что значит оптимизация под raid массивы
Как создать RAID-массив
Содержание
Содержание
У любого пользователя ПК рано или поздно появляется целая коллекция накопителей, или особые требования, которые одним диском не решить. Например, увеличение скорости, надежности системы хранения, или просто удобства использования. И с этим может справиться RAID-массив. Так как нельзя объять необъятное, рассмотрим только те случаи, с которыми может столкнуться обычный пользователь Windows 10. Конечно же, в первую очередь, понадобится оборудование.
Что может понадобиться
Материнская плата. Преимущество в том, что она у вас уже есть, а вот недостатков хватает:
Если хотя бы один пункт вас не устраивает — вам, скорее всего, понадобится внешний контроллер, например:
Накопители. Желательно наличие поддержки RAID-контроллеров. Разница, по сравнению с обычными, заключается в поведении при нештатной ситуации. В случае возникновения ошибки обычный накопитель, в попытках решить проблему самостоятельно, может не успеть отчитаться перед контроллером, что закончится разрушением массива. Также стоит обратить внимание на наличие других оптимизаций для работы в RAID. Например, повышенную устойчивость к вибрации. Чем больше нагрузка и дисков тем больше эффект от таких оптимизаций.
Корзина не менее важна. Чем больше дисков и чем больше нагрузка на них, тем важнее виброизоляция.
Так выглядит достаточно хорошая корзина в потребительском корпусе — обратите внимание на голубые вставки виброгасящего материала:
Конечно, это далеко не предел возможностей корзины. В RAID-массивах диски работают практически синхронно, а если они одной модели, то имеют практически одинаковые резонансы, что при большой нагрузке в обычном корпусе может привести к поломке за считанные недели.
Охлаждение.Забывать про обдув накопителей тоже не стоит. Оптимальная температура 30–45 градусов. С такой задачей справится обычный тихий кулер, главное чтобы он был и работал.
Самые распространенные типы массивов
Проще всего сделать массив средствами ОС
Опционально можно убедиться, что в настройках прошивки SATA переведены в режим AHCI в зависимости от материнской платы это может дать возможность замены дисков прямо на работающем компьютере. Для этого надо найти соответствующие настройки в прошивке. Лучше всего ознакомиться с руководством или обзорами для вашей материнской платы. Конкретно на этой материнской плате AHCI активен всегда, даже в режиме RAID.
На старых чипсетах выбор чуть больше.
В случае если установлен режим IDE, переставлять сразу в AHCI не стоит, практически наверняка это вызовет BSOD. В любом случае этот пункт не обязателен. Даже если в системе есть SSD, режим IDE пропускает команду TRIM. Но если хочется, то можно запустить программу Sysprep перед сменой IDE на SATA в прошивке. Установленная галочка снесет активацию и не только на Windows.
Данная процедура предназначена для OEM-сборщиков, которые настраивают систему перед продажей. Также создается новый пользователь в системе, через которого и придется зайти. И потом просто удалить лишнего пользователя куда проще, чем ковыряться в реестре. Если не успеете зайти в прошивку до загрузки ОС, то придется повторить. Поэтому убедитесь, что у вас не включен Ultra Fast Boot.
После подготовительных процедур можно приступать к созданию массива. Для этого правой кнопкой по меню пуск вызывается управление дисками.
Новый диск потребуется инициализировать, после этого выберите соответствующий вашим запросам уровень массива:
После этого запустится мастер создания томов:
Для RAID 1 лучше не использовать максимальный объем. Купленный в будущем, диск на замену вышедшему из строя, может оказаться чуть-чуть меньше. Также можно сделать RAID 1 для операционной системы, но в случае GPT разметки и отказа загрузочного накопителя потребуется восстановление UEFI загрузчика.
Более сложный способ — средствами материнской платы
Придется прогуляться на сайт производителя чипсета и скачать все, что имеет в своем названии RAID.
И тут всплывает первый подводный камень. Инсталлятор драйверов RAID отказывается устанавливаться, при отсутствии активированного в прошивке RAID.
И на этом все. Потому что если ОС установлена на SATA, это приведет к невозможности загрузки без дополнительных манипуляций с прошивкой. При загрузочном NVMe можно активировать режим RAID для SATA, и спокойно поставить драйвера. В случае, если загрузочный накопитель и будущий RAID на базе SATA, можно поставить все три драйвера в ручном режиме. ВНИМАНИЕ! Это приведет к невозможности загрузки в обычном режиме.
Теперь, когда пути назад нет, обратите внимание на эти пункты (при других параметрах BIOS доступа к настройкам массивов не будет):
И только после сохранения и перезагрузки откроется доступ к настройкам:
По умолчанию из всех существующих накопителей создаются JBOD с 1 накопителем в массиве. Поэтому надо удалить массивы, в которых оказались накопители для RAID:
Спешка тут не нужна, потому что расстаться с важной информацией на этом этапе очень просто. Положение Enabled означает, что массив будет удален:
Теперь после того, как появились накопители не участвующие ни в одном массиве, на их базе создается новый:
В данном случае Volume соответствует JBOD, а RAIDABLE — диски, предназначенные под автоматическое восстановление массива:
Объем массива можно поменять с помощью цифровой клавиатуры.
Теперь, когда создание закончено, возвращаемся в Windows, и, через управление дисками, с массивом можно работать как с обычным диском. Обратите внимание — объем, полученный с помощью материнской платы, чуть меньше. Недостача ушла на нужды контроллера.
После инициализации в неразмеченной области можно создать обычный том. Мастер будет выглядеть практически так же, как и выше за пропуском нескольких пункт.
Если же предстоит установка Windows, содержимое архива с названием nvme_sata_raid_windows_driver надо закинуть на установочную флешку в распакованном виде. И в процессе установки указать — откуда их брать.
Установить надо все три драйвера в указанной последовательности.
После чего можно продолжить установку как обычно. И все это не зря, по сравнению с массивом, созданным на базе ОС:
Массив, созданный с помощью матплаты умеет кешировать данные хоть и не большого объема:
Комплектное ПО RAIDXpert2 по большей части дублирует возможности прошивки.
Оно позволяет производить все операции не покидая ОС. Конечно, это не исчерпывающее руководство к действию, но позволит обойти самые распространенные грабли.
Целесообразность и преимущества применения серверных накопителей, построение RAID-массивов, стоит ли экономить и когда?
На рынке доступно большое количество накопителей различных скоростей, различных производителей. Далеко не все четко понимают, какой диск лучше приобрести и для какой задачи и зачем порой лучше заплатить больше, а когда можно сэкономить. В этой статье я постараюсь прояснить основные моменты и сделать проблему выбора более простой. Статья будет полезна не только тем, кто хочет купить/арендовать выделенный сервер, но и тем, кто хочет получить надежное хранилище информации дома. После прочтения материала станет понятным, почему не всегда целесообразно арендовать desktop-решения в low-cost дата-центрах и лучше остановить выбор на более надежном, серверном железе.
Начнем с того, что все имеющиеся на рынке накопители, можно четко разделить на классы:
— диски для обычных desktop-ов (применяются в домашних ПК, в ноутбуках и в desktop-серверах low-cost дата-центров);
— серверные диски со скоростью 7200 оборотов в минуту (RPM);
— Enterprise-диски со скорость 10 000 и 15 000 RPM;
— твердотельные накопители.
Особенности выбора твердотельных накопителей мы, пожалуй, рассмотрим в отдельной статье, а сейчас остановимся преимущественно на жестких дисках и рассмотрим какой диск где и когда целесообразно применять.
Начнем с обычных дисков для PC. Это отличные диски с довольно большой емкостью и хорошей производительностью, но их главный недостаток в том, что они не рассчитаны на работу в RAID-массиве в силу своих конструктивных особенностей. В этих дисках вибрации, вызываемые вращением шпинделя, практически никак не компенсируются. Конечно эти вибрации минимальны и в случае применения 1-2 дисков в домашних условиях они не являются проблемой. Однако, если рассматривать серверный случай, когда дисков много, влияние вибраций может быть довольно существенным, так как возникают взаимные вибрации, резонанс усиливает эффект. Так, когда в корпусе установлено сразу 12 дисков, да еще и работают довольно мощные серверные вентиляторы по 5000-9000 оборотов в минуту — уровень вибрации нарастает довольно значительно, а с ними и % ошибок, потерь, что и оказывает негативное влияние на производительность. Производительность дисков десктопного типа падает в этих случаях в разы, так как они испытывают значительные трудности с позиционированием головок, теряют дорожку. Это хорошо можно видеть из популярного графика зависимости производительности от вибрационной нагрузки:
Другое дело диски SATA RE (RAID Edition) или же серверные диски со скоростью 7200 RPM. Они менее подвержены вибрациям и в меньшей степени зависят от них. Как видим из графика — вероятность возникновения ошибки в результате вибраций на 50% ниже для них.
Но не только вибрации являются проблемой, другая основная проблема всех дисков — уровень невозобновимых ошибок. Что это означает на практике?
Для SATA PC дисков уровень невозобновимых ошибок 1 ошибка на 10 14 бит, или 1 ошибка на 12,5 ТБ данных. Диск на 1ТБ имеет 1000/12500х10 14 бит. 5 дисков имеют емкость 5х(1000/12500х10 14 ) бит, а вероятность возникновения ошибки при работе этих дисков в массиве RAID5 будет составлять (5х(1000/12500х10 14 ))/10 14 x100% = 40%.
Как видим, использовать 5 PC-дисков в RAID5 просто нельзя, так как вероятность возникновения невосстановимой ошибки при ребилде очень высока и ребилд завершится скорее неудачно. Таким образом мы получим массив, который заведомо выйдет из строя в случае ребилда и данные будут утеряны. Ранее я не знал об этой особенности и в 2008-м году, когда собирал свой первый сервер еще на PC-шных накопителях, построил именно RAID5-массив, с целью экономии дискового пространства и денег, и менее, чем через месяц, данные были потеряны. Сейчас мне удивительно, что массив прожил так долго 🙂
Конечно, можно применять более надежные уровни RAID, такие, как RAID10 или в крайнем случае RAID6, но при большом количестве дисков мы также будем получать довольно высокую степень вероятности возникновения невосстановимой ошибки во время ребилда.
Другое дело серверные диски со скоростью 7200 оборотов в минуту (RPM) SATA RE или диски Near Line (NL) SAS. Вероятность невосстановимой ошибки для них на порядок меньше уже за счет их технических особенностей, 1 ошибка возникает на 10 15 бит данных. Тем не менее, при использовании не только большого количества накопителей, но и накопителей большого объема — этого может быть уже недостаточным и в таких случаях все же придется применять SAS-накопители Enterprise класса, степень надежности которых 1 невосстановимая ошибка на 10 16 бит данных.
Стоит также отметить, что на самом деле для дисков SATA RE, Near Line (NL) SAS и дисков SAS Enterprise-класса, по сути дисков, которые умеют эффективно взаимодействовать с RAID-контроллером, вероятность возникновения невосстановимой ошибки еще значительно меньше, как раз за счет этой способности. Так, при работе с нагруженным массивом (базы данных, с которыми работают сразу много пользователей, активная запись и считывание данных) начинают играть роль уже восстановимые ошибки, с которыми обычные диски работают неэффективно. Они пытаются перечитать проблему многократно — в тех же Western Digital значение установлено на 64 прохода головки с разными параметрами высоты, угла, только после чего головка переходит к обработке других задач. За счет этого сильно возрастает время ожидания, которое RAID не терпит и непременно сочтет диск потерянным и попытается восстанавливать диск, в результате чего нагрузка на массив приобретет критичный характер, так как одновременно с рабочей нагрузкой будет идти еще и ребилд. Результат предсказуем — крах всего массива.
Диски, которые умеют работать с RAID, могут сообщить RAID-контроллеру, что есть проблема с чтением блока данных, запросить этот блок с других дисков и в это время обрабатывать другие запросы, а получив блок — перезаписать его в другом месте проблемного диска. За счет этого никакого падения производительности RAID-массива не происходит и вероятность потери данных снижается значительно. Однако следует отметить, что не все софтовые рейд-контроллеры, установленные на чипсетах, умеют «понимать» такие диски, потому порой недостаточно иметь диски RE для надежного массива, а все же требуется применение аппаратного контроллера или другой платформы, которая корректно работает с RAID.
Тем не мене, если есть желание собрать более надежное хранилище, нежели хранилище на PC-накопителях, можно купить более дешевые диски, нежели диски RE, к примеру Constellation CS, которые предназначены для работы исключительно с софтовыми рейдами и лишены недостатка десктопных (попыток многократного перечитывания данных в ущерб другим задачам), при этом полноценно, само собой, с контроллерами они не взаимодействуют, так что cбои RAID полностью не исключены.
Вне зависимости от того, какой накопитель Вы применяете, Вы также должны помнить о том, что у дисков есть кеш — 32, 64 МБ и более. Что это значит для RAID-массива? С точки зрения производительности кеш является плюсом, как для чтения, так и для записи. Однако с точки зрения надежности записи — это минус. Используя кеш, рейд-контроллер будет думать, что уже записал данные на массив, но на самом деле они могут быть только в кеше, а на диск записаны быть позднее. В зависимости от размера массива растет и размер общего кеша, и в случае 12 накопителей кеш составляет уже почти гигабайт. Что произойдет с данными при отключении питания? Правильно. Они будут утеряны. И если речь идет о файлопомойке, тут, наверное, не на столько критично, но если же речь идет о базах данных — будет весело. Потому рекомендуется для данных особой критичности, такие, как базы данных, все же отключать кеш на запись. Это снизит производительность диска на 8-15% в режиме баз данных, однако в значительной степени увеличит надежность. По этой причине, если Вы приобретаете хранилище данных большой емкости, крупные производители отключают там кеш по умолчанию и включить его невозможно. Применяя же диски в серверах, особенно в low-сost дата-центре, где питание к серверу не резервировано, нужно помнить об этом риске и учитывать его.
Также отметим еще одну ключевую особенность дисков SAS Enterprise-класса, на них данные хранятся еще более надежно, так как минимальный размер кластера составляет 520 байт, а не 512, добавляется еще 8 байт для проверки четности. Применяется большое количество алгоритмов восстановления данных без участия контроллера. Именно по этой причине объем этих дисков не бывает очень большой.
К слову на счет объема, крайняя рекомендация, если у Вас есть задача хранить данные надежно, не пытайтесь использовать диски большего объема, нежели это необходимо, так как в случае ребилда восстановление будет занимать больше времени. Как правило контроллеры не анализируют то, сколько реально занято на диске и восстанавливают весь диск в целом, потому разница во времени восстановления между 1 ТБ и 6 ТБ накопителем будет более, чем в 6 раз.
Подведем итоги. Исходя из вышеизложенного понятно, что для небольшого RAID-массива, применение самых дорогостоящих дисков Enterprise класса не принципиально и не дает никаких преимуществ в надежности. Тем не менее, применение серверных дисков весьма желательно, так как в этом варианте на порядок большая вероятность того, что ребилд завершится успешно. Не следует применять диски большего объема, чем это необходимо, за исключением случаев, когда нужно обеспечить более высокую производительность по IOPS (в некоторых дисках большего объема все же может быть выигрыш по скорости за счет большего количества головок и пластин). В случаях, когда необходим большой объем и много дисков и при этом достаточный уровень надежности — можно смотреть в сторону SAS NL, которые по сути являются модифицированным вариантом накопителей SATA RE за счет интерфейса SAS, однако имеют все те же 7200 RPM. Для повышения уровня надежности целесообразно применять RAID более высокого уровня. Когда же объем массива не принципиален и требуется максимальная надежность, нужно однозначно применять SAS 15000 RPM Enterprise.
Теперь, выбирая в аренду сервер в Нидерландах, у нас на площадке Switch, при помощи конфигуратора, расположенного в нижней части страницы http://www.ua-hosting.company/servers, либо, модифицируя одно из спец. предложений:
Приходит понимание того, какие диски и какой из серверов лучше использовать и для каких задач, когда лучше использовать диски в RAID, а когда по отдельности, распределяя файлы софтом в зависимости от популярности (скрипт балансера в зависимости от нагрузки). Почему 4 диска большего объема, в плане надежности, может быть лучше, чем 12 меньшего, но хуже в плане времени восстановления в случае ребилда. Ну и самое важное — почему наше предложение реально крутое для серверного сегмента и мы реально приблизили цену к desktop-площадкам, при этом сохранив на порядок более высокую надежность без преувеличений! Так что если Вам, либо Вашим знакомым нужен хороший сервер — welcome, распродажа некоторых конфигураций из списка ниже ограничена, очень скоро цены на эти конфигурации будут выше, мы хоть и щедры, но не безгранично :):
Да, если у кого-то есть реальный опыт применения тех или других накопителей для определенных задач — не стесняйтесь делиться им в комментариях. Интересно все, вплоть до статистики отказов. На эту тему, как и по поводу проблематики выбора SSD-накопителя, мы постараемся опубликовать материал позднее.
Зачем платить больше, или SATA «RAID Edition»
Обычный SATA диск, встречая сбойный кластер, пытается восстановить записанную на нем информацию. Вначале – читая его повторно, затем – пробуя прочесть данные с использованием встроенных алгоритмов восстановления. И в течении всего времени «восстановления» диск “не отзывается” на команды извне, сообщая, что «занят». Такое поведение вполне оправдано, если диск – единственный в системе, и приоритетом является восстановление нигде не продублированных данных.
Аппаратный RAID-контроллер, когда один из дисков длительное время не обрабатывает адресованные ему запросы, приходит к выводу, что диск – неисправен.
В лучшем случае «неисправность» приводит к признанию всей информации на данном HDD недействительной и ребилду массива с заполнением всего диска данными. Заново, за счет восстановления с других дисков в RAID-группе. И на период ребилда происходит деградация производительности всей дисковой подсистемы, вплоть до 50%.
В худшем случае – к примеру, на одном из дисков RAID-группы окажется еще одни десктоный диск SATA со сбойным кластером – весьма вероятно разрушение массива с риском потери всех данных. Со всеми вытекающими.
Основное отличие прошивки дисков «RAID Edition» в первую очередь заключается в реакции на сбойный кластер. Не сумев прочитать информацию, диск «RAID Edition» помечает блок данных как «сомнительный», сообщает о сбое RAID-контроллеру. RAID-контроллер восстанавливает данные сбойного кластера за счет информации на других дисках RAID-группы. И передает восстановленные данные в том числе диску со сбойным блоком, для записи в другом секторе на диске. В случае восстановления данных за счет RAID-контроллера диск просто помечает «сомнительный» блок как «сбойный». Если RAID-контроллер данные восстановить не смог – тогда диск пытается сам восстановить информацию за счет алгоритмов восстановления, в фоновом режиме. В обоих ситуациях диск с прошивкой «RAID Edition» продолжает обслуживание других запросов и сообщает RAID-контроллеру “я живой”.
Остальные отличия в прошивке, к примеру более агрессивные алгоритмы считывания и менее «экономичный» режим работы, повышают производительность при множественных запросах и снижают время доступа к данным. Они важны, но не критичны.
Таким образом, в серверах и рабочих станциях, в RAID-массивах с аппаратными RAID-контроллерами рекомендуется использовать именно версию «RAID Edition», коли уж делается выбор в пользу высокоёмких и относительно дешевых дисков SATA.
Напечатать
Отправить другу