Столкнулся вчера с настоящим чудом! Приехал днем на машине к Пушкинской площади. Я конечно отдавал себе отчет, что парковаться будет проблематично, но “проблематично” это не совсем верное слово, особенно учитывая что машину было нужно бросить часа на два, а потом хотелось еще и уехать. В третьем ряду стояли с аварийкой те, кто ожидал кого-нибудь, сидя в машине. Ну что-ж, поехал нарезать круги по близлежащим переулкам – может быть повезет и кто-нибудь прямо из под носа уедет. Про то, что на знаки “остановка запрещена” конечно все плевать хотели, наверное не стоит и упоминать. И вот, буквально сразу, натыкаюсь на каким-то чудом пустующее место рядом с въездом во дворик какой-то конторы. С криком “ура!” паркуюсь, становлюсь поплотнее, чтобы никому не помещать. Но стоило мне выйти из машины, как из дворика, из-за шлагбаума выбегает охранник и быстро шагает ко мне. Ну вот, думаю, начинается - “Вы к кому приехали?”, “это места для наших сотрудников”, и т.д. и т.п… Уже морально готов высказать все, что думаю на эту тему. Но тут я слышу, что именно он мне говорит! “Подвиньте машинку на метр вперед, а то сейчас кто-нибудь Вас запрет и Вы выехать долго не сможете.” Это меня просто убило! Я даже не к ним в контору приехал! (да и охранник, я уверен, видел что я и не собирался к их зданию вообще подходить) Сказать, что я был шокирован таким к себе отношением – это значит не сказать практически ничего. Все-таки есть нормальные люди, которые вот просто так помогут и сделают это совершенно бескорыстно. За это и хочется сказать “БОЛЬШОЕ СПАСИБО” всем тем, кто (пусть и со стороны кажущимися незначительными, но на самом деле очень важными поступками) делает жизнь окружающих немного лучше!
среда, 31 марта 2010 г.
среда, 24 марта 2010 г.
В помощь виртуальным и отказоустойчивым :)
Вышла очередная книжка за авторством Mike Laverick, посвященная работе с VMware Site Recovery Manager (SRM). В книге очень подробно и с многочисленными примерами рассказывается о том, как и что можно делать в версии SRM 4.0. Примеры включают в себя не только непосредственно работу с SRM, но и настройку таких систем хранения как EMC Celerra и Clariion, NetApp FAS и HP LeftHand. Самый главный минус для российских читателей – книга на английском языке, впрочем это, к счастью, для многих не самая большая сложность. А самый главный плюс (помимо замечательного содержания) – ее можно совершенно бесплатно скачать в pdf формате, что и настоятельно рекомендуется сделать!
Новые JBOD от LSI
LSI анонсировал две модели 6Gb/s SAS JBOD (ящики для жестких дисков), предназначенные для подключения непосредственно к SAS контроллерам LSI и 3Ware. Модель 630J имеет 12 отсеков для дисков 3.5’’, а модель 620J – 24 отсека для 2.5’’ дисков. Оба варианта поддерживают 6Gb/s SAS (используется экспандер LSI SAS2x36), имеют стандартную высоту 2U, оснащены двумя блоками питания (система охлаждения находится в блоках питания, поэтому она также дублирована), в базе идет один ESM модуль, но можно установить и второй для обеспечения отказоустойчивости. Поддерживаются диски SAS или SATA (правда пока не очень понятно, будут ли доступны отдельно мультиплексоры для подключения SATA дисков в конфигурации с двумя ESM).
Каждый ESM модуль имеет по два SFF-8088 порта для подключения к хостам и один порт для каскадирования. Последовательное подключение JBOD позволит обеспечить необходимый запас для дальнейшего расширения:
Целевая аудитория – все, кто еще “не созрел” материально на внешнюю дисковую систему, либо те, кому достаточно отказоустойчивости, которую обеспечивает DAS, а гораздо более важна производительность системы.
понедельник, 22 марта 2010 г.
Оптимальный stripe-size для RAID-массива
Очень часто задают вопрос о том, как правильно выбрать stripe-size для того или иного массива. Как посчитать, а что будет если на массиве и SQL, и файловый сервер. А если SQL работает с дисками блоками по 8КБ, а RAID-контроллер не позволяет задать такой страйп, то наверное все теперь будет работать неоптимально и вообще наверное нужно искать такой контроллер, где stripe в 8КБ можно задать? На самом деле, все это не совсем так. То что какое-то конкретное приложение общается с дисками блоками по ххКБ вовсе не означает, что именно такой stipe-size будет оптимальным. Поэтому практически всегда на вопрос “как настроить, чтобы было лучше”, следует простой ответ: “оставьте то значение, которое предлагается по умолчанию”. Разработчики прошивки тратят много времени на оптимизацию кода прошивки, тратят много сил на обеспечение высокой производительности. Но все эти оптимизации наилучшим образом работают как раз на выбранных в качестве “default” значениях. До недавнего момента я все это говорил, ссылаясь исключительно на свое понимание вопроса, но на днях представитель Adaptec в своем блоге разместил точно такой же совет:
While there is credibility in doing the maths and trying to match the stripe size to the OS/application requirements, the reality is that the defaults will “normally” walk all over specifying a particular size. Why? Because our engineers spend a lot of time in making the defaults work best. We aim to make an out-of-the-box experience for the majority of users, and put a lot of effort into making the product work without a user having to be a rocket scientist to use it.
Зачем же производитель контроллеров дает выбор? Конечно, в ряде случаев можно получить дополнительные проценты (хотя обычно все-таки доли процентов) производительности, тщательно проанализировав характер нагрузки и выбрав значение, которое характерно именно для нее. Особенно это будет заметно, если размер блоков, которыми приложение общается с дисками, будет больше, чем stripe по умолчанию, а нагрузка создается преимущественно случайным обращением. Но такая ситуация возникает довольно редко, поэтому если никакие экстраординарные приложения использовать не предполагается, отдайтесь на волю разработчиков и пусть они, зная свой продукт изнутри, выберут для Вас правильные настройки.
P.S. Здесь речь идет о внутренних RAID-контроллерах. В “больших” системах есть свои особенности, связанные с работой кэша, и там оптимизация настроек может дать более заметный эффект.
четверг, 11 марта 2010 г.
Как избежать проблем с СХД (хотя бы отчасти)
Несколько дней назад (по большей части от любопытства) занимался реанимацией IBM DS4500. На всякий случай – с 2003 до 2006го года это была старшая система класса midrange у IBM. Потом на смену ей пришла DS4800, а с год назад и DS5100/DS5300, а пациент все работал и работал на благо … ну наверняка на чьё-то благо он все-таки работал. Только вот в какой-то момент ему стало тошно от такой жизни и решил он уйти на покой вместе со всеми данными. Сказал, что и дисков он своих знать не хочет, и с контроллерами у него не все ладно (да на всякий случай от одного сразу и открестился). И пришлось вокруг старичка попрыгать разве что не с бубном. По счастью, завести эту DS4500 удалось (конечно не без какой-то там матери, но главное при помощи девственно чистого файберного диска, лежавшего в загашнике). После “оживления” оказалось, что и контроллеры оба замечательно себя ощущают, и диски все живы, и даже данные оказались на своих местах. Но повозиться пришлось изрядно, а одна из основных причин состояла на мой взгляд в том, что прошивка на системе стояла чуть ли не та, с которой она вышла с завода. Сама по себе, возникшая проблема со старой прошивкой связана скорее всего не была, но вот будь она (прошивка) поновее, решение проблем потребовало бы в несколько раз меньше времени. Поэтому решил я дать несколько рекомендаций для тех, кто администрирует различные системы хранения:
- Как правило, производитель рекомендует определенную версию прошивки для каждой системы (разумеется, со временем рекомендуемая версия меняется). Не стоит пренебрегать этим! Даже если проблем с системой нет, раз в пол-года проверяйте актуальные рекомендации и просматривайте список изменений. Даже если Вы не будете обновлять систему, Вы хотя бы будете знать какие проблемы были исправлены (вполне возможно что Вы уже с этими проблемами сталкивались, но не соотнесли их с СХД) – предупрежден, значит вооружен!
- Самую последнюю прошивку, которая вышла “вот только вчера ночью”, устанавливать можно лишь в том случае, когда в системе есть серьезные проблемы, которые мешают ее нормальной эксплуатации! Прошивать “продуктив”, чтобы проверить “ту самую фишку”, которую только что анонсировали, не стоит – проблемы, которые могут возникнуть, сильно омрачат Вашу радость от мизерных улучшение. Если все-таки нужны новые возможности, то оптимальный путь – дождаться следующего обновления и, если не было найдено критических ошибок, доведите версию ПО до предыдущей.
- Убедитесь, что фоновые процедуры проверки работают – в противном случае можете оказаться лицом к лицу с “вылетевшим” вторым (третьим) диском при перестроении массива. Чем это грозит наверное можно даже и не упоминать.
- Регулярно проверяйте состояние батарей, защищающих кэш. Заранее озаботьтесь заказом новых. Помните, что при выходе батареи из строя, большинство СХД отключают кэш записи. После этого производительность может снизиться в нескольких раз. Конечно есть ненулевой шанс найти батарейку “живьем” в Москве или другом городе, но если система Ваша не новая (а тем более, если она уже снята с производства), батарейка эта наверняка провалялась на складе не один год. Так что нашли-то Вы ее “живьем”, а вот по факту она окажется “трупом”. Лучше прождать два-три месяца (в наших реалиях), но получить батарею, которая прослужит хотя бы пару лет.
- Следите за состоянием массива даже если он находится на вторых (третьих или четвертых) ролях. Потому как по закону подлости на нем обязательно окажутся данные, которые есть в единственном экземпляре (“вот только вчера записали, а сегодня хотели бэкап сделать”) и которые ни в коем случае нельзя потерять. Только вот массив-то уже месяц был в критическом состоянии, а сегодня его совсем медным тазом прикрыло.
Ну и два главных совета:
- Постарайтесь, чтобы слова “О, а у нас оказывается есть СХД!” звучали не только тогда, когда эта СХД сломалась!
- Если есть финансовая возможность продлевать сервисное обслуживание, то этим Вы существенно облегчите себе жизнь! А если такой возможности вроде бы и нет, то постарайтесь аргументировать для людей, выделяющих финансы, необходимость этого продления – в случае возникновения проблем в системе без сервиса, решать эти проблемы придется скорее всего Вам самому.
вторник, 9 марта 2010 г.
Милиция меня бережет?
На Волгоградском проспекте (там где постоянно и утром и вечером пробки в обе стороны от ТТК до пересечения с Люблинской) уже довольно давно сделали реверсную полосу. Конечно стало лучше – раньше гаишники все равно делали такой же реверс вручную, перекрывая то одну полосу, то другую. Теперь же все “как надо” – висит световая индикация, всем все понятно и пробка из мертвой превратилась в вяло-текущую. Но в последние выходные я несколько раз и утром, и вечером этим маршрутом проезжал в разные стороны. И пробка была на месте (в разном направлении, но была всегда), а вот реверс – выключен. Т.е. совсем. В выходные видимо решили что незачем – важным людям работать не нужно, а быдло может и в пробках постоять. Ну да ничего, наши водители самые грамотные в мире и они сами (по относительной плотности движения) определяют, кому можно сейчас на реверс, а кому – нет. Радует, что при мне никто в лоб друг другу не прилетел (разница в загрузке направлений была довольно велика). Но ведь шанс-то есть! Понятно, что по правилам туда вообще выезжать нельзя, раз сигнал не горит, но кто-ж у нас пустую полосу пропадать оставит! А поставь там наряд на день, так им потом можно будет сразу увольняться и уезжать жить в теплые края (учитывая, что выезд на реверс тянет на лишение, а это ой-ой-ой какие тарифы нынче). Ну или все равно увольняться и уже в места не столь отдаленные (учитывая “наезды” на органы в последнее время). Но или деньги не нужны, или собирать боятся, а план по лишениям в других местах выполнили, но вот кого я там ни разу не видел, так это представителей ГИБДД. Черт бы с ними, с гаишниками, – пусть бы стояли и “собирали” с нарушителей, но ведь реально может кто-то “влететь” по-крупному – один выедет на реверс “по-инерции” за впереди пролетевшей машиной, а навстречу ему какой-нибудь красавец с мигалкой (хорошо если включенной), которому очень надо. А потом общественность будет бушевать и обвинять чиновников что разъездились, гаишники будут обвинять неграмотных водителей, водители будут ругать всех подряд. А пару жизней уже не вернешь. (Пример никак не связан с недавними нашумевшими событиями.) А достаточно было всего-то и следить за работой светофоров все 7 дней в неделю, чтобы избежать ненужных рисков. Но похоже мы для милиции – просто мясо, которое можно использовать вместе с машинами для задержания преступников. В Белоруссии, между прочим, таким же “деятелям” дали два года (пусть и условно), а у нас что будет? Пожурят или в другой отдел переведут?
Какой Xeon лучше для Vmware?
Daniel Bowers высказал в одном из HPшных блогов очень интересную точку зрения на то, какой именно Intel Xeon серии 5500 может быть наиболее привлекателен для виртуализации. Вывод сделан на основе анализа графика цен и показателей производительности процессоров в тестах SPEC.org. Наиболее “интересным” (с точки зрения цена/производительность) оказался процессор Xeon E5520. Действительно, у процессоров, память которых работает на одной частоте, производительность в SPECcpu2006 (который был выбран в качестве определяющей величины) меняется довольно слабо, а вот цена – весьма существенно. Поэтому с точки зрения получения “минимально-оптимальной” производительности за лучшие деньги, выбор E5520 более чем оправдан. Но, с другой стороны, не задумываясь следовать за этим советом конечно не стоит – в ряде случаев производительность имеет определяющую роль (и эта производительность не всегда в точности соответствует результатам SPECcpu2006. Анализ текущей нагрузки может дать много полезных ответов.