Ответы на часто задаваемые вопросы о бюджетных устройствах хранения данных

  1. Какой интерфейс подключения устройства хранения является самым эффективным?
  2. Можно ли использовать в док-станциях жесткие диски объемом более 2 ТБ?
  3. Какой уровень RAID рекомендуется использовать в дисковом массиве начального уровня?
  4. Какое реальное быстродействие достигается в бюджетных дисковых массивах?
  5. Насколько надежно хранение данных на RAID массиве?
  6. Что делать, если RAID система отключила один из установленных дисков как неисправный?
  7. Можно ли использовать в RAID массиве диски разной емкости?
  8. Что такое NAS и чем он отличается от обычного RAID массива?
  9. Можно ли использовать NAS для совместного редактирования видео в рабочих группах?
  10. Обязательно ли применение UPS при использовании бюджетных устройствах хранения данных?

1. Какой интерфейс подключения устройства хранения является самым эффективным?

Чаще всего устройства хранения, предназначенные для персонального использования, оснащены USB 2.0 (сейчас уже USB 3.0) и eSATA (External SATA) разъемами. Более редко встречаются  порты FireWire 400 и FireWire 800, актуальные в основном для МАС компьютеров (сегодня им на смену идет ThunderBolt). Их теоретические (пиковые) скорости передачи данных таковы: USB 2.0 - 480 Мбит/с (т.е. 60 Мбайт/с), USB 3.0 - 5 Гбит/с (500 Мбайт/с), eSATA (External SATA) – 3 Гбит/с (300 Мбайт/с), FireWire 400 – 400 Мбит/с (50 Мбайт/с), FireWire 800 – 800 Мбит/с (80 Мбайт/с), ThunderBolt – 10 Гбит/с (1 Гбайт/с). Здесь важно отметить, что в современных ThunderBolt и FireWire 800, eSATA и USB 3.0 для обеспечения надёжной передачи данных используется избыточное кодирование 8/10 бит. Это значит, что один байт данных передаётся с помощью 10-бит - в ущерб пропускной способности. Поэтому пересчет с битов на байты осуществляется с соотношением 10:1 вместо 8:1 как у USB 2.0 и FireWire 400.
На практике скорость передачи заметно ниже теоретической, так как часть времени теряется на обработку служебных команд, в результате возникают заметные задержки между запросом на передачу данных и собственно началом передачи. Подобные накладные расходы особенно велики у USB протокола, так что, например, USB 2.0 оказывается медленнее даже FireWire 400. Результирующие данные сведены в нижеследующую таблицу.

Тип интерфейса

Теоретическая пропускная способность (в одну сторону)

Реальное быстродействие (средний поток на запись/чтение)

Максимальная длина кабеля

USB 2.0

480 Мбит/сек

35 Мбайт/сек

FireWire 400 (1394a)

400 Мбит/сек

40 Мбайт/сек

4,5м

FireWire 800 (1394b)

800 Мбит/сек

80 Мбайт/сек

100м

eSATA

3 Гбит/сек

250 Мбайт/сек

USB 3.0

5 Гбит/сек

400 Мбайт/сек

ThunderBolt

10 Гбит/сек

800 Мбайт/сек

Таким образом, если при подключении одиночных жестких дисков в большинстве случаев ограничиваются USB 2.0 интерфейсом, то для хранилищ из 4-5 дисков, объединенных в единый RAID массив с потенциальной производительностью в сотни мегабайт/сек, целесообразно использование eSATA или USB 3.0.

2. Можно ли использовать в док-станциях жесткие диски объемом более 2 ТБ?

Можно, но иногда результате подключении такого диска емкостью к компьютеру, он может не опознаваться совсем, опознаваться частично или опознаваться верно, но без возможности доступа. Следует знать, что данные проблемы связаны с использованием системы разметки MBR (основная загрузочная запись) в 32-разрядных версиях операционных систем Windows 2000 и XP, т.к. размер тома в них не может превышать 2 ТБ. Чтобы воспользоваться диском емкостью более 2 ТБ, необходима операционная система поддерживающая систему разметки GPT (таблица разделов с применением GUID) - Windows 7, Windows Vista, Mac OS 10.4 и Mac OS 10.5.

3. Какой уровень RAID рекомендуется использовать в дисковом массиве начального уровня?

Большинство предлагаемых на рынке внешних корпусов, допускающих установку от 2 до 5 жестких дисков, имеют встроенные контроллеры с аппаратной поддержкой нескольких RAID уровней. Как правило, это 0, 1, 3, 5, Combine (NRAID) и JBOD (Just a Bunch of Drives). Напомним, что:
RAID 0 – простое распараллеливание, веерная запись/чтение блоками на все установленные диски. Самая высокая производительность, минимальная цена на гигабайт хранения, но отсутствие защиты от сбоя. Поскольку RAID 0 определяет простейший вариант построения массива - без избыточности дисков, то, строго говоря, он даже не является RAID. Тем не менее, этот уровень официально утвержден консорциумом по стандартизации RAID (RAID Advisory Board, RAB) и широко используется на практике.
RAID 1- зеркалирование, т.е. дублирование всех записей на две идентичные группы дисков. Обеспечивается самая высокая степень защиты критически важных данных, но как следствие - вдвое меньший доступный объем хранения. На практике в основном используется в 2-х дисковом варианте для хранения небольших объемов критически важных данных.
RAID 3 – входной поток данных разбивается на блоки, по всем битам которых вычисляются контрольные значения четности. Запись/чтение осуществляется параллельно на все диски, но при этом для контрольных данных выделяется отдельный диск. При сохранении высокого быстродействия (сравнимого с RAID 0) данные не теряются при выходе из строя одного (любого) из дисков.
RAID 5 – аналогичен RAID 3, но запись значений четности (контрольных сумм) распределена между всеми дисками. Кроме того, уменьшен размер блоков записываемых данных, что увеличивает быстродействие системы при большом количестве запросов на запись/чтение небольших файлов. Combine (он же NRAID или Non-RAID) – простое «сложение» нескольких дисков в один большой диск суммарной емкости.
JBOD – просто набор исходных дисков без какого-либо объединения.
Понятно, что RAID 0, Combine и JBOD не обеспечивают никакой защиты информации от сбоев, и могут быть рекомендованы только для кратковременного хранения данных, не являющихся критически важными. RAID 1 используется в основном в 2-х дисковых устройствах хранения. Из оставшихся уровней наиболее популярным оказывается RAID 5, обеспечивающий оптимальное сочетание быстродействия и надежности.  Важно подчеркнуть, что в RAID 3 и 5 один из подключенных дисков фактически «теряется» под запись значений четности. Таким образом, в системе хранения из 4-х дисков собственно для данных остается только 3 диска, т.е. потеря эффективной емкости (по сравнению, например, с RAID 0) составляет 33%. А вот для 5-дискового устройства она уменьшается до более разумных 25%.

4. Какое реальное быстродействие достигается в бюджетных дисковых массивах?

Средняя скорость записи/чтения повседневных 3,5” SATA дисков со скоростью вращения 7200 оборотов/с составляет около 100 МБайт/с (реальные показатели зависят от множества факторов, в том числе метода тестирования). Объединяя несколько дисков в пакет и организуя простое распараллеливание записи между ними, для 4/5-дисковой системы можно ожидать увеличения скорости до 400 Мбайт/сек. На практике реальное быстродействие бюджетных устройств заметно ниже, так как ограничивается производительностью используемых в них недорогих RAID контроллеров. Так, например, у популярной модели SI-1359RUSI3 на 5 дисков, построенной на базе контроллеров JMB393+JMS539 от JMicron Technology, при уровне RAID 5 по USB 3.0 и eSATA скорость на запись составляет около 180 Мбайт/сек, а на чтение достигает 235 Мбайт/с. Полезно напомнить, что при подключении по FireWire 800 основным ограничивающим фактором является уже сам интерфейс, так что результирующая скорость составляет соответственно около 80 Мбайт/с. Впрочем, данные показатели для устройств ценового диапазона до $500 являются весьма достойными. Для достижения более высоких значений в первую очередь необходимо использовать более производительные (и более дорогие) RAID контроллеры, и параллельно увеличивать число дисков в системе. Так, например, один из первых RAID массивов с поддержкой интерфейса ThunderBolt – Promise Pegasus R6 на 6 дисков по результатам тестирования обеспечивает среднюю скорость около 600 Мбайт/с. Но при этом его цена уже превышает $2000. Справедливости ради надо объяснить, что наличие ThunderBolt (также как и прочих фирменных технологий Apple) заметно удорожает любое изделие. Для сравнения можно привести комплект из RAID контроллера HighPoint RocketRAID 2722 и внешнего корпуса на 8 дисков SI-9442, обеспечивающего скорость до 800 МБайт/с, при розничной цене в $1500.

5. Насколько надежно хранение данных на RAID массиве?

В этом мире нет ничего абсолютно надежного. Использование RAID 3 и 5 защищает информацию лишь при неожиданном выходе из строя одного диска (хотя далее работать уже не стоит, и необходимо установить в систему новый диск и дать ей возможность восстановить все данные). Но это никак не спасает от сбоев по питанию, выхода из строя сразу двух дисков, поломки встроенного RAID контроллера и прочих напастей. Именно поэтому в серьезных (профессиональных) системах предусматриваются избыточные блоки питания, батареи защиты содержимого кеш-памяти, устанавливаются по 2 идентичных RAID контроллера, встраиваются различные утилиты самодиагностики и оперативной проверки состояния дисков. Однако даже такая глубокоэшелонированная оборона не может полностью защитить от всех возможных неприятностей (пожара, наводнения, кражи). Так что для критически важных данных всегда рекомендуется формировать, регулярно обновлять и удаленно хранить резервную копию.

6. Что делать, если RAID система отключила один из установленных дисков как неисправный?

Смысл защиты данных в RAID массиве 3-го или 5-го уровня именно в том, что при выходе из строя одного (любого) диска данные не теряются. Но сам по себе факт его неисправности весьма тревожный, так как нередко свидетельствует о том, что и другие диски уже ненадежны, близки к поломке. В этом случае во избежание более серьезных неприятностей настоятельно рекомендуется:
- остановить процессы записи/чтения данных на данный массив,
- заменить неисправный диск на новый той же (или большей) емкости,
- дождаться окончания процесса Re-Build (восстановления на новом диске всех данных, включая контрольные значения четности).
И только после этого можно продолжать работу.

7. Можно ли использовать в RAID массиве диски разной емкости?

Можно, но это будет не очень эффективно. В большинстве случаев  система будет подстраивать конфигурацию RAID массива под диск меньшей емкости. Например, если в ваш корпус установлен один диск на 1 ТБ и 3 диска по 2 ТБ, то RAID массив будет построен из 4-х дисков по 1 ТБ, остальной объем будет проигнорирован.

8. Что такое NAS и чем он отличается от обычного RAID массива?

NAS (Network Attached Storage) – это сетевое устройство хранения общих данных, доступных всем пользователям локальной сети. Одно из наиболее распространенных применений – создание архивов медиа данных, например фильмов и фотографий. Аппаратно идея NAS довольно проста - фактически это специализированный компьютер с прошитой в памяти (ПЗУ) операционной системой (обычно это какой-либо клон Linux). Но "прошиваются" только те части операционной системы, которые предназначены для обслуживания функций файлового сервера с общим доступом по сети. Поддерживаются различные RAID уровни хранения данных, но программно. Из того, что операционная система "зашита" в ПЗУ, вытекает весьма важная особенность NAS - его крайне трудно "взломать" снаружи. Такая оптимизация операционной системы исключительно под нужды файлового сервера приводит к сравнительно высокому быстродействию NAS. Большинство NAS устройств характеризуются следующими общими чертами:

  1. Встроенная операционная систем основана на Linux.
  2. RAID всегда программный. Как следствие, невысокая скорость записи на внутренний RAID, если выбран 5 уровень RAID и запись осуществляется несколькими пользователями одновременно.
  3. Для управления используется несложный web интерфейс с рядом жестко зафиксированных возможностей.
  4. Любые программные проблемы с NAS могут быть решены только с помощью фирмы-производителя. Внутренняя операционная система с точки зрения пользователя представляет собой black box (черный ящик) без малейшей возможности что-либо изменить.
  5. Во многих моделях NAS встроенное программное обеспечение записывается и хранится на тех же жестких дисках, что и собственно данные. В случае краха NAS и замены дисков конфигурировать NAS часто приходится заново.
  6. Для расширения возможностей/ликвидации проблем невозможно установить дополнительное программное обеспечение.

Одним словом, NAS – это закрытая для пользователей система с собственной внутренней организацией хранения и доступа к данным. Это и есть его основное отличие от обычного RAID массива, подключаемого напрямую к рабочему компьютеру и видимого как обычный локальный диск системы.

9. Можно ли использовать NAS для совместного редактирования видео в рабочих группах?

Можно, но это будет не очень эффективно.  Хотя на первый взгляд вроде бы все должно получиться. Реальная полоса гигабитной сети составляет 60-70 мегабайт в секунду, и ее должно хватить чуть ли на 20 DV потоков цифрового видео стандартного разрешения. Иными словами, вроде бы 10 человек могут в реальном времени смотреть и редактировать DV видео, хранящееся на рабочем NAS. Но на практике результат оказывается плачевным - даже 5 человек не могут совместно комфортно работать. Если же речь идет о монтаже видео с HD разрешением, то «тесно» будет уже 2-м. Дело в задержке реакции на запросы видеомонтажной программы. Поскольку полоса в сети делится между всеми пользователями, то и время реакции на каждый запрос программы увеличивается в разы по сравнению с локальным диском. Разница между работой с локальным диском (под локальным диском здесь и далее мы будем понимать любой локальный диск, массив и т.п.) и работой по сети будет тем заметнее, чем мощнее рабочая станция и чем быстрее ее локальный диск. Пропускная способность сети фактор постоянный - и в результате, перекачивая туда-сюда данные по сети, практически уменьшается производительность собственно рабочей станции. Вывод – для полноценного видеомонтажа рекомендуется использовать устройство хранения (RAID массив), напрямую подключенное к компьютеру (и лучше по скоростному интерфейсу).

10. Обязательно ли применение UPS при использовании бюджетных устройствах хранения данных?

Обязательно, потому что в недорогих RAID контроллерах не предусмотрено резервное питание для кэш-памяти контроллера. Поэтому, если запись в кэш-память контроллера разрешена (параметр), то случайное отключение электричества в момент выполнения операций записи может привести к разрушению структуры RAID и к полной потере информации. Для защиты от подобных ситуаций при отсутствии UPS следует отключить режим записи в кэш-память (Write Through), что существенно ухудшит производительность дисковой системы. Однако надо обязательно помнить, что применение UPS при включенном параметре Write Back не спасает от потери данных RAID массива при выходе из строя блока питания системного блока или самой материнской платы компьютера.