Восстановление данных в России и СНГ
Малая Пироговская, 18, офис 406
Пн-Пт 9:00 - 21:00, Сб-Вс 9:00 - 17:00
Круглосуточный телефон

Восстановление RAID 5, 16 дисков WD2001FASS, Maxtronic SS-6601E, Москва

  • Задача: Восстановление RAID
  • Уровень RAID массива: RAID 5
  • Тип хранилища: Maxtronic SS-6601E
  • Объем массива: 27 Терабайт
  • Диски: 16 * Western Digital Caviar Black WD2001FASS 7200rpm 64Mb 2Тб
  • Город: Москва
  • Файловая система: HFS+

Постановка задачи клиентом

Был массив RAID 6 из 15 дисков, 16-й диск — Hot Spare. 11-й диск выпал из массива (помечен, как 17-й), заменили, запустили ребилд, который не прошел до конца (примерно на 25% прервался). Сняли посекторную копию вылетевшего диска, ввели в массив — не прижился. Стали сливать данные. Удалось спасти примерно на 50%. После чего красным загорелся индикатор 8-го диска. Более ничего не предпринимали. Надо восстановить все данные.

Диагностика

Исследование дисков показало, что это был не RAID 6 на 15 дисков + Hot Spare, а RAID 5 на все 16 дисков. Таким образом, при любых проблемах с одним любым диском массив переходил в состояние degraded и у него не было запасного диска для автоматического запуска перестроения массива (array rebuild). Это и произошло — один диск (17-й) выпал из-за маленького количества бэд блоков, массив перешел в degrade. С массивом продолжили работать, добавив новый диск и запустив rebuild на новый диск. Данные на выпавшем диске стали неактуальны — они не синхронизированы с остальными дисками. Из-за повысившейся нагрузки вышел из строя еще один диск (8-й) и весь массив стал недоступен - перешел в состояние FAIL. Шансов пройти rebuild у RAID 5 из 16 дисков по 2 Тб практически не было — слишком долго идёт процесс и слишком увеличивается нагрузка на диски.

Одному из необходимых для восстановления дисков очень плохо — он очень медленно отдаёт данные. Будем вычитывать его с помощью программно-аппаратного комплекса PC3000, а после этого восстанавливать данные со всего массива.

Восстановление

Процесс восстановления диска WD2001FASS занял примерно неделю — диск был в очень тяжелом состоянии. После этого была создана виртуальная копия массива, из которой мы успешно восстановили данные с RAID 5. Для этого заказчик предоставил 16 новых 2 Тб дисков, на которых был создан RAID 6 из 15 дисков, а 16-й диск назначили Hot Spare. Допоолнительно обновили прошивку Maxtronic SS6601E - новая версия исправляла ошибки работы под нагрузкой, которая появляется во время rebuild.

Заключение

Основной причиной потери данных является неправильная конфигурация массива - вместо RAID6/15+Hot Spare был создан RAID5/16. При таком размере массива и объеме дисков, шансы на появление проблем во время rebuild слишком высоки — массив становится очень уязвим к любым проблемам, даже к одному проблемному сектору на любом диске.

 

Если с вашим оборудованием происходят похожие проблемы и вам требуется восстановление данных, звоните по круглосуточным телефонам 8 (495) 280-18-99, 8 (812) 449-48-22 чтобы проконсультироваться с нашими специалистами.

Закажите восстановление данных