11/05/2007

Отчего умирают винчестеры: небольшой обзор причин выхода из строя жёстких дисков

Он есть у каждого из нас. Он - наше всё в прямом смысле слова, маленький кусочек высоких технологий и точной механики, на котором хранятся наши бесценные данные: фотографии, тексты, фильмы, музыка, конфиги и собственно операционная система. Это - Винчестер. Но рано или поздно, он выходит из строя - почему?

Предыстория вопроса
Всё началось с того, что я на работе решил скачать свежий Debian Testing и перенести его домой на мои большие винчестеры. Всё скачалось и записалось, выключил ноутбук в штатном режиме - в общем, всё, как всегда. Однако при копировании была выдана ошибка: I/O Error, и в логах dmesg засветилось:
hda: dma_intr: status=0x51 { DriveReady SeekComplete Error }
hda: dma_intr: error=0x40 { UncorrectableError }, LBAsect=35807470, high=2, low=2253038, sector=35807428
ide: failed opcode was: unknown
end_request: I/O error, dev hda, sector 35807428
Приехали - по диску пошли битые сектора. Дело плохо, и я решил посмотреть на данные SMART, чего, признаться, уже давно не делал.
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000b 100 100 062 Pre-fail Always - 0
2 Throughput_Performance 0x0005 100 100 040 Pre-fail Offline - 0
3 Spin_Up_Time 0x0007 192 192 033 Pre-fail Always - 2
4 Start_Stop_Count 0x0012 099 099 000 Old_age Always - 1904
5 Reallocated_Sector_Ct 0x0033 100 100 005 Pre-fail Always - 0
7 Seek_Error_Rate 0x000b 100 100 067 Pre-fail Always - 0
8 Seek_Time_Performance 0x0005 100 100 040 Pre-fail Offline - 0
9 Power_On_Hours 0x0012 085 085 000 Old_age Always - 6651
10 Spin_Retry_Count 0x0013 100 100 060 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 965
191 G-Sense_Error_Rate 0x000a 100 100 000 Old_age Always - 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 2
193 Load_Cycle_Count 0x0012 071 071 000 Old_age Always - 299688
194 Temperature_Celsius 0x0002 144 144 000 Old_age Always - 38 (Lifetime Min/Max 11/44)
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 5
197 Current_Pending_Sector 0x0022 100 100 000 Old_age Always - 1

198 Offline_Uncorrectable 0x0008 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x000a 200 200 000 Old_age Always - 0
А вот и герой торжества: сбойный сектор отловлен, и он уже не одинок - их там пятеро. Обидно перекачивать такой большой файл (хотя при подсчёте MD5SUM значение выдавалось правильное), но ещё обиднее терять данные - тут же была сделана резервная копия самых важных данных. Через день я выполнил на нём полное тестирование по SMART, и оно прошло гладко. Теперь сбойный сектор исчез (для меня, но не для SMART), и их теперь шестеро.
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000b 099 099 062 Pre-fail Always - 0
2 Throughput_Performance 0x0005 100 100 040 Pre-fail Offline - 0
3 Spin_Up_Time 0x0007 204 204 033 Pre-fail Always - 2
4 Start_Stop_Count 0x0012 099 099 000 Old_age Always - 1906
5 Reallocated_Sector_Ct 0x0033 100 100 005 Pre-fail Always - 0
7 Seek_Error_Rate 0x000b 100 100 067 Pre-fail Always - 0
8 Seek_Time_Performance 0x0005 100 100 040 Pre-fail Offline - 0
9 Power_On_Hours 0x0012 085 085 000 Old_age Always - 6659
10 Spin_Retry_Count 0x0013 100 100 060 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 966
191 G-Sense_Error_Rate 0x000a 100 100 000 Old_age Always - 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 2
193 Load_Cycle_Count 0x0012 071 071 000 Old_age Always - 299691
194 Temperature_Celsius 0x0002 171 171 000 Old_age Always - 32 (Lifetime Min/Max 11/44)
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 6
197 Current_Pending_Sector 0x0022 100 100 000 Old_age Always - 0

198 Offline_Uncorrectable 0x0008 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x000a 200 200 000 Old_age Always - 0
В общем, я уже понемногу откладываю деньги на новый винчестер, а пока решил выяснить, почему же они помирают.

Статьи, на которые я буду ссылаться, научные, так что не ищите там выкриков "самсунг\сигейт отстой\рулёз" и конкретных рекомендаций "покупайте у Васи - не прогадаете". Кто не знаком с жанром научной статьи, говорю сразу: это не рецепт, а скорее пища для дальнейших размышлений. Написано всё максимально дипломатично и завуалировано, но так, чтобы читатель уловил основные идеи, однако не ждите, что все результаты долгих исследований вам выложат на блюдечке с голубой каёмочкой. Это напоминает то, как одна хозяйка другой рассказывает рецепт своего фирменного блюда: вроде бы все ингредиенты упомянуты, но фирменный штрих, который и делает блюдо таким замечательным, скорее всего сказан не будет.

Так или иначе, я старался внимательно следить за хитросплетениями мыслей авторов статей и смог-таки кое-что выцедить оттуда.


Причины, статистика, анализ
Итак, статья "Failure Trends in a Large Disk Drive Population" проливает немного света на причины выхода из строя винчестеров на серверах Гугл - авторы собирали данные в течении полутора лет (с декабря 2005 по август 2006) с почти 100.000 винчестеров, диски были SATA и ATA, 5400 и 7200 RPM, ёмкостью от 80 до 400Гб разных производителей.

Главное, на что упирают гугловцы, что SMART - вовсе не панацея от всех бед и что ориентирование только на данные SMART в большинстве случаев (особенно индивидуальных) ничего не даёт. Большая часть их дисков померли в то время, как по SMART они были совершенно здоровы и без каких либо сообщений об ошибках.

Сообщается также, что вероятность гибели винчестера слабо связана с его степенью загруженности. Но если SMART сыплет ошибками типа scan errors, reallocation counts, offline reallocation counts, and probational counts - дело дрянь и пора делать бекапы :-)


Возраст
Вероятность отказа, как и следовало ожидать, растёт с возрастом диска, то есть с тем временем, которое он отработал. Диски, работающие до 1 года, чаще всего дохнут в первые три месяца. Резкий скачок вероятности выхода из строя - 2 года.


Производитель
В исследовании говорится, что, вопреки расхожему мнению, выход из строя жёсткого диска слабо зависит от того, кто произвёл этот диск, а больше зависит от конкретного экземпляра и в меньшей степени от того, в каких условиях он эксплуатируется. В доказательство они приводят тот факт, что данные по сбоям, регистрируемым SMART, почти не зависят от того, диски чьих производителей анализируются.


Нагрузки

Дальше они приводят данные по зависимости смертности дисков от степени их загруженности (т. е. от дисковых операций).



График из работы "Failure Trends in a Large Disk Drive Population", Eduardo Pinheiro, Wolf-Dietrich Weber and Luiz Andre Barroso, Google Inc., Appears in the Proceedings of the 5th USENIX Conference on File and Storage Technologies (FAST’07), February 2007

Оказывается, что только очень новые (до 3 месяцев) и очень старые (старше 3 лет) чаще всего дохнут от высоких нагрузок, в остальных возрастных категориях вероятность выхода из строя от нагрузок зависит слабо.


Температура
Считается, что температура - важнейший фактор для жёсткого диска и что лучше диски охлаждать. Здесь главное не дойти до маразма: температура винчестера ниже 15 градусов по Цельсию удваивает среднюю частоту выхода их из строя.



График из работы "Failure Trends in a Large Disk Drive Population", Eduardo Pinheiro, Wolf-Dietrich Weber and Luiz Andre Barroso, Google Inc., Appears in the Proceedings of the 5th USENIX Conference on File and Storage Technologies (FAST’07), February 2007

Гугловцы выяснили, что с повышением температуры винчестера риск отказа растёт медленно - хуже того, есть тенденция к тому, что дискам больше страшны низкие температуры. Интересно, что минимальный риск выхода из строя приходится на интервал температур от 36 до 45 градусов. Риск выхода из строя при температурах меньше 25 градусов почти вдвое больше, чем при 45, и возрастает быстро с уменьшением температуры.

Диски возраста до 2 лет чаще дохнут от холода (при температуре от 15 до 30 градусов), а старики (от 3 лет) мрут от перегрева (более 45 градусов).



Анализ данных SMART

Самые важные ошибки, на которые следует обращать внимание: Scan Error, Reallocation Count Offline reallocation Probational Count

Ошибка сканирования (Scan Error).
Электроника диска время от времени сканирует поверхность диска незаметно для пользователя и передаёт данные SMART - если будут найдены битые сектора, они, как правило, вскоре будут заменены на свободные. Однако гугловцы говорят: после первой же ошибки сканирования поверхности, вероятность выхода из строя винчестера в следующие 60 дней возрастает почти в 40 раз!


Количество перемещений (Reallocation Count).
Если при чтении информации возникают ошибки ввода-вывода и операционная система о них сообщает, такие ошибки перехватываются SMART и сбойный сектор заменяется нормальным из набора доступных. Количество перемещений отражает износ поверхности, однако это ещё не повод бить тревогу: около 90% гугловских винчестеров имеют отличное от нуля количество перемещений, хотя при этом годовая вероятность сбоя (
Annualized Fault Rate, AFR) повышается в 3-6 раз. После первого же перемещения сбойного участка, вероятность выхода из строя в следующие 60 дней увеличивается в 14 раз.


Остальные ошибки (в том числе Seek Error) не дают заметного вклада в общую статистическую картину дисковой смертности. Примечательно, что, например, выход диска из строя слабо соотносится с количеством циклов "старт-стоп". Однако если диску более 3 лет, следует его использовать непрерывно, так как частых включениях и выключениях вероятность выхода из строя повышается на 2%.

В общем, гугловцы призывают не уповать на SMART и его в общем не высокую предсказательную силу (более 56% всех умерших дисков не имели отметок об ошибках SMART), а больше налегать на бекапы и резервирование, чем почти никто не занимается, пока жареный петух не клюнет в известное место.

На десерт - самое вкусное: распределение вероятностей ошибок по данным SMART. На кладбище гугловых винчестеров винчестеры встречаются со следующим распределением сбоев:
Ошибки, которые SMART не отловила - 60%
Reallocation Count - около 40%
Seek Error - 30%
Offline Reallocation - 28%
Probe Count - 20%
Scan Error - 15%
CRC Error - менее 5%.
Ясно, что винчестеры дохнут не от одной ошибки, а чаще всего от нескольких, лидирует в которых сбойные сектора и ошибки позиционирования.
Следует отметить, что в винчестерах отдельных производителей Raw_Read_Error_Rate и Seek_Error_Rate параметры достигают максимума и обнуляютя несколько раз в день. Это связанно с политикой некоторых производителей в отношении SMART: в эти параметры пишутся все ошибки, а остальные производители только те, что не смог отловить контроллер.
За информацию спасибо s7ang3r


Время наработки на отказ
Другая статья, "Disk failures in the real world: What does an MTTF of 1,000,000 hours mean to you?", подробно разбирает, что такое MTTF, или mean time to failure. Статистика также очень впечатляющая (около 100.000 устройств).

Многие производители оценивают отказоустойчивость двумя связанными друг с другом оценками: ежегодная частота ошибок (Annualized failure rate, AFR) и среднее время отказа (mean time to failure). AFR оценивается на основе предсказаний по результатам ускоренных тестов, а MTTF оценивается как время работы за год делённой на AFR. Ведущие производители дисков заявляют, что MTTF их устройств - от 1 млн. часов до 1.5 млн. часов в соответствии с AFR равной 0.58% и 0.88% соответственно.
Для любознательных: делается это потому, что проверять диски непосредственно, включив их и оставив, скажем, на 4-5 лет, просто невозможно, потому как производителю данные о надёжности нужны сейчас, а не через 5 лет, когда эти диски безнадёжно устареют. Поэтому разработаны и проводятся так называемые ускоренные тесты, при которых устройства загоняют в заведомо невыносимые условия работы (страшная жара \ лютый мороз и катастрофические дисковые нагрузки) и смотрят, сколько они в таком режиме протянут. Ясное дело, что дохнут они там очень быстро - и эти данные потом экстраполируются (т.е. пересчитываются с предсказанием) на нормальные условия работы. Конечно, точность таких предсказаний не слишком высока, но это лучше, чем ничего.
Чаще всего исходные данные таких исследований строго охраняются компанией-производителем и не просачиваются за пределы лабораторий. На выходе цифры, полученные такими методами, несколько приукрашиваются отделом маркетинга, и мелкими буквами вписываются на сайте для тех, кто интересуется.
Искать правду в этой мутной воде - дело гиблое, и остаётся ориентироваться на научные исследования разной степени достоверности, отчёты о которых время от времени публикуются на научных конференциях.
В статье говорится о том, что их данные о частоте замены винчестеров ввиду сбоев, мягко говоря, расходятся с тем, что заявляет производитель. Так, в трёх дата-центрах, в которых снимались данные для этой статьи в течение 5 лет, в общем случае замены жёстких дисков в связи со сбоями были несколько чаще, чем замена планок оперативной памяти, в 2.5 раза чаще, чем замена процессоров, в 2 раза чаще, чем замена материнских плат. Факт остаётся фактом: сбои винчестеров - одни из самых распространённых причин остановки узлов дата-центров для замены оборудования.

Дальше в рамках исследования было вычислено значение ежегодной частоты ошибок (AFR) для всех датацентров, в которых это исследование проводилось, и вот график:


График взят из работы: Bianca Schroeder, Garth A. Gibson "Disk failures in the real world: What does an MTTF of 1,000,000 hours mean to you?", FAST ’07: 5th USENIX Conference on File and USENIX Association Storage Technologies.

Он стоит тысячи слов: горизонтальная сплошная прямая соответствует заявляемым 1.5 млн. часам безотказной работы, горизонтальная пунктирная - 1 млн. часов, а точечная - реальному усреднённому времени работы. Согласно этому, AFR составляет 3%, а соответствующее MTTF - около 300 тыс. часов.

Но и эта цифра несколько завышена: не секрет, что в дата-центрах сделано всё, чтобы оборудование работало дольше. Это и системы кондиционирования, и распределение вычислительной нагрузки, и защита от перегрева \ переохлаждения отдельных компонентов и проч. Едва ли в пользовательских машинах имеется нечто подобное, особенно это касается ноутбуков.

Разброс таких данных велик: AFR составляет от 0.5% до 13.6%, и это в дата-центрах. Последняя цифра соответствует примерно 7 годам работы винчестера, но понятно, что в бытовых устройствах эта цифра намного скромнее: постоянно меняющаяся температура устройства, небольшое время непрерывной работы, скачки напряжения, большое количество циклов "старт-стоп" и прочее сильно сокращают время жизни жёстких дисков.

Ещё один замечательный график, показывающий жизненный цикл жёстких дисков в зависимости от времени работы:

График из работы J. Yang and F.-B. Sun., "A comprehensive review of hard-disk drive reliability". In Proc. of the Annual Reliability and Maintainability Symposium, 1999.

Как остроумно назвали авторы работы такую форму графика, "bathtub curve", т.е. кривая в форме ванной :-)

Интересные выводы в работе такие:
  1. MTTF, которое заявляет производители, более чем в 3 раза превосходит тот, который оценен в реальных условиях дата-центров.
  2. Для старых винчестеров, отработавших 5-8 лет, переоценка MTTF производителями составляет более 30 раз.
  3. Даже для сравнительно новых жёстких дисков (менее 3 лет работы) MTTF производителем завышена по крайней мере в 6 раз.
  4. Частота замен для дорогостоящих SCSI-дисков и обычных SATA почти одинакова.
И далее по работе: Для дисков, чьё время непрерывной работы менее 5 лет, частота замены в связи со сбоями в 2-10 раз больше той, которая следует из времени MTTF, а для старше 8 лет эта частота замен в 30 раз больше.


Как просмотреть информацию SMART
Для этого уже должны быть установлен пакет smartmontools, который содержит в том числе утлиту smartctl. После этого:
  • для IDE-дисков пишем smartctl --all /dev/hda
  • для SCSI-дисков smartctl --all /dev/sda
  • для SATA-дисков smartctl --all -d ata /dev/sda
Будет выведена длинная таблица, в которой будет много интересного.

smartctl version 5.36 [i686-pc-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Device Model: HTS421260H9AT00
Serial Number: HKA210AJGKHV1B
Firmware Version: HA2OA70G
User Capacity: 60.011.642.880 bytes
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: 7
ATA Standard is: ATA/ATAPI-7 T13 1532D revision 1
Local Time is: Fri Oct 19 17:12:58 2007 MSD
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

Здесь, собственно, информация о винчестере - размер, серийный номер.



=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 645) seconds.
Offline data collection
capabilities: (0x5b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 47) minutes.

Здесь данные о том, какие тесты поддерживаются SMART в устройстве и сколько они по времени будут занимать.

А дальше идёт самое интересное.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000b 100 100 062 Pre-fail Always - 0
2 Throughput_Performance 0x0005 100 100 040 Pre-fail Offline - 0
3 Spin_Up_Time 0x0007 202 202 033 Pre-fail Always - 1
4 Start_Stop_Count 0x0012 099 099 000 Old_age Always - 1930
5 Reallocated_Sector_Ct 0x0033 100 100 005 Pre-fail Always - 0
7 Seek_Error_Rate 0x000b 100 100 067 Pre-fail Always - 0
8 Seek_Time_Performance 0x0005 100 100 040 Pre-fail Offline - 0
9 Power_On_Hours 0x0012 085 085 000 Old_age Always - 6745
10 Spin_Retry_Count 0x0013 100 100 060 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 978
191 G-Sense_Error_Rate 0x000a 100 100 000 Old_age Always - 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 2
193 Load_Cycle_Count 0x0012 071 071 000 Old_age Always - 299731
194 Temperature_Celsius 0x0002 196 196 000 Old_age Always - 28 (Lifetime Min/Max 11/44)
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 6
197 Current_Pending_Sector 0x0022 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0008 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x000a 200 200 000 Old_age Always - 0

Выделенные красным строки - для повышенного внимания, полужирным - для внимания пристального. В общем, если данные в них ненулевые, то есть имеются определённые ошибки, это ещё не повод для вселенской катастрофы, просто сигнал к тому, что неплохо бы выяснить адресок ближайшего сервис-центра по обслуживанию ноутбука вашей фирмы и отложить немного денег на замену винчестера. Хорошо бы ещё сделать полный дамп данных, пока это ещё возможно (чтобы потом залить на новый винчестер сразу всё). Или по крайней мере сделать копию содержимого /etc и /home


Error 4 occurred at disk power-on lifetime: 6652 hours (277 days + 4 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 d6 ee 60 22 e2 Error: UNC 214 sectors at LBA = 0x022260ee = 35807470

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
25 00 00 c4 60 22 e0 00 00:29:58.200 READ DMA EXT
25 00 00 c4 5f 22 e0 00 00:29:58.200 READ DMA EXT
25 00 00 c4 5e 22 e0 00 00:29:58.200 READ DMA EXT
25 00 00 c4 5d 22 e0 00 00:29:58.200 READ DMA EXT
25 00 00 c4 5c 22 e0 00 00:29:58.100 READ DMA EXT

Далее пойдёт описание ошибок, если таковые случались. У меня это была ошибка ввода-вывода.

Ниже будут следовать данные о том, какие тесты запускались и чем они окончились. Если они завершились с ошибками - это верный признак скорой кончины винчестера.

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Completed without error 00% 6651 -
# 2 Short offline Completed without error 00% 6651 -
# 3 Short offline Completed without error 00% 3097 -
# 4 Short offline Completed without error 00% 806 -

Надеюсь, что эта статья поможет выяснить причину, почему сломался жёсткий диск.


Ссылки
Для дальнейшего изучения параметров SMART можно обратиться к этой ссылке, здесь говорят о SMART в целом. Эта статья также многое поможет прояснить.

58 комментариев:

  1. Винчестеры - расходные материалы. Это уже давно пора в прайсах поправить.

    Если это принять за аксиому, жизнь становится легче, потому как становится понятнее реальная и насущная необходимость RAID1, RAID5 и бэкапов.

    "RAID1, RAID5, бэкапы, RAID1, RAID5, бэкапы", повторять как мантру, делать каждый день. :)

    ОтветитьУдалить
  2. Совершенно верно, Роман! ППКС!

    ОтветитьУдалить
  3. Теперь понятно от чего у меня 2 харда померло... Когда читал о температуре, тут же судорожно посмотрел на дачик... фух, блин 42 по Целсию. А в целом многое узнал :)

    RAID1, RAID5, бэкапы
    RAID1, RAID5, бэкапы

    а сколько в день повторять? :)

    ОтветитьУдалить
  4. У меня есть старенький винт Seagate Barracuda 4 40Gb. На нём уже два или три раза появлялись bad-блоки, но интересно то, что они были не физическими, а программными. Т.е. происходил сбой по питанию и появлялся bad. После dd if=/dev/zero of=/dev/sda винт снова работал как новый. Последний раз я делал это год назад (как раз тогда сменил блок питания), с тех пор bad-блоки не появлялись.

    ОтветитьУдалить
  5. Спасибо за обзор!

    ОтветитьУдалить
  6. А чем опасно Power-Off_Retract_Count?

    На сколько мне известно это лишь счетчик некошерных power off`ов, когда питание было отключено до остановки винчестера. Иначе говоря, это не показатель внутренних ошибок в винте, но скорее ошибок в железе прочем (если ноутбук очень внезапно отрубается это явно не хорошо), либо же в софте (как недавно было с убунтой).

    ОтветитьУдалить
  7. 2 Роман Химов пишет...
    Винчестеры - расходные материалы.
    Твоя, Роман, правда.

    становится понятнее реальная и насущная необходимость RAID1, RAID5 и бэкапов.
    Увы, на ноутбуке рэйд не сделаешь. Но бекапы это да, это мантра :-)

    2 Träumer пишет...
    Теперь понятно от чего у меня 2 харда померло...
    Бывает так, что диск по смарту здоров, а потом бац - и в морг.

    Когда читал о температуре, тут же судорожно посмотрел на дачик... фух, блин 42 по Целсию.
    А у меня на ноуте 33. Вот и дума - печку на него поставить, что ли? :-)

    А в целом многое узнал :)
    Я тоже, когда читал. Было навеяно первым бедблоком.

    2 GiNeR пишет...
    На нём уже два или три раза появлялись bad-блоки, но интересно то, что они были не физическими, а программными.
    Никакие они не программные, а самые настоящие аппаратные. Просто смарт их вылавливает и переносит данные (если может) в другие сектора.

    2 Roman Cheplyaka пишет...
    Спасибо за обзор!
    Пожалуйста. Статьи есть, но они на английском. А вообще захватывающее чтиво :-)

    2 Nikolay пишет...
    А чем опасно Power-Off_Retract_Count?

    На сколько мне известно это лишь счетчик некошерных power off`ов, когда питание было отключено до остановки винчестера.

    Возможно повреждение поверхности при таких отключениях. Провоцирование бедблоков.

    ноутбук очень внезапно отрубается это явно не хорошо
    А как такое может быть, если у ноута свои аккумуляторы?

    либо же в софте (как недавно было с убунтой).
    Нормально всё с убунтой, если вы про Load_Cycle_Count. Я, собственно, пост выкатил на два дня раньше потому, что у них там гвалт поднялся из-за этого.

    ОтветитьУдалить
  8. "Никакие они не программные, а самые настоящие аппаратные. Просто смарт их вылавливает и переносит данные (если может) в другие сектора."
    Да, ты прав, никогда раньше смарт не смотрел.
    Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 17

    ОтветитьУдалить
  9. > Увы, на ноутбуке рэйд не сделаешь.
    :) У меня на ноуте RAID1.

    Таких сейчас несколько моделек есть с двумя винчестерами. Небесплатные нифига, конечно, но зато на душе спокойней. Хотя, бэкапов на сервер с RAID5 и готовым диском на замену это не отменяет. :)

    Кстати, единственный момент, который здесь меня озадачил, так это связь (а точнее, вроде как, отсутвие её) количества включений/выключений и смертности. Тов. Гибсон (который автор SpinRite) очень много нехорошего на эту тему говорил. Чисто с физической точки зрения тоже логично, раскручивание, нагрев, охлаждение, нехорошие переходные процессы, должны влиять.

    ОтветитьУдалить
  10. Спасибо за статью. Как раз сегодня вокруг винтов с бубном танцевал. Но подозрения всё-таки на контроллер на матери...

    ОтветитьУдалить
  11. год назад работал в провайдерской конторе, меняли сервера ибо оные устарели морально

    так вот, сказюки, которые проработали десять лет без сбоев просто начинают сыпаться, когда приносиш их на рабочее место с целю просто покапаться на машинке ))))

    а вобще ощущение такое, что они как растения: либо приживаются и растут либо быстро погибают ))))

    ОтветитьУдалить
  12. У меня веник старый WD 15Gb до сих пор зараза работает
    А новые веники в основном Seagate 8,9 250-400 Gb летят как перелетные птицы.

    Тут дело не только в объеме. Дело в том что у производителей винчестеров очень большая конкуренция. Кто веник продаст побольше объемом да подешевле. Из этого вся беда.
    Был у меня веник Seagate 250 на домашнем Debiane - с системой что-то творилось неладное постоянные зависания не в тему и че я только не делал и веник проверял все было с ним нормально. Снес всю систему и переставил на старенький Seagate 80Gb и все улеглось.

    ОтветитьУдалить
  13. Гмм... Я вот что то к смарту особенно не пирглядывался, а щас вот решил посмотреть че как, особенно после истерики с ubuntu.

    лишнее поскипал.


    1 Raw_Read_Error_Rate 100 100 046 84993

    2 Throughput_Performance 100 100 030 27394048

    3 Spin_Up_Time 100 100 025 1

    4 Start_Stop_Count 099 099 000 1121

    5 Reallocated_Sector_Ct 100 100 024 8589934592000

    7 Seek_Error_Rate 100 100 047 2602

    8 Seek_Time_Performance 0x0005 100 100 019 Pre-fail Offline - 0



    Я так понимаю мой винт на том свете фонарями ищут... Хотя, по его работе этого не скажешь...

    ОтветитьУдалить
  14. [quote]...Обидно перекачивать такой большой файл (хотя при подсчёте MD5SUM значение выдавалось правильное)...[/quote]
    Заново перекачивать - это излишне.
    Можно примонтировать этот образ для использования jigdo (jigdo-file, jigdo-lite).
    С помощью этой утилиты очень удобно обновлять образы. Скачиваются только изменённые файлы.

    ОтветитьУдалить
  15. Не понимаю истерии, как правильно заметили выше винты и правда расходный материал.
    Они дешевы, поэтому вылетел винт - да и фиг с ним... вставил новый, залил бакап и всё как прежде.

    ОтветитьУдалить
  16. > Количество перемещений отражает износ поверхности
    Это неверно.У HDD нет особых причин для износа поверхности - головы над ней парят на вохдушной подушке.Так что перемещение сбойного сектора означает лишь что он почему-то не прочитался.Обычно это связано с локальным дефектом (пылинка осела, поверхность точечно повреждена, магнитное покрытие в этом месте не очень хорошее, etc).

    ОтветитьУдалить
  17. > Возможно повреждение поверхности при таких отключениях.
    У нормально спроектированных дисков ничего такого не возможно, всю жизнь HDD отрубаются без оповещения о данном факте потому как особенности схемы питания в PC.И все диски при этом обязаны коректно запарковать головы без приключений.Иначе бы все гарантийки давно бы уже были завалены HDD в количестве почти равном числу проданных HDD :)

    ОтветитьУдалить
  18. > винты и правда расходный материал.
    А ваше время на **лю со всем этим - тоже расходный материал?Да и бэкапы не каждые 5 минут делаются.Потери данных неизбежно будут.И это может быть неприятно.

    ОтветитьУдалить
  19. > А новые веники в основном Seagate 8,9 250-400 Gb летят как перелетные птицы.

    Сигейт нынче замечен в ХАЛЯВЕ.Делают свое добро в китае и при том в отличие от других - НЕКАЧЕСТВЕННО.Скажем бывает плохая балансировка пакета дисков.А это уже пц.Вроде и по гарантии не сдашь но и понятно что шансы у этого хлама сдохнуть от своей же вибрации растут на порядок.По сигейтам сейчас большой процент возвратов и обращений в гарантийки.У всех производителей бывает период неудачных моделей.Сейчас это у сигейта.

    ОтветитьУдалить
  20. Кстати о гвалте, убунте и том ноуте с диском от хитачи.

    Хитачевцы пользуются собственной фирменной системой парковки голов.У хитачей головы выводятся за пределы диска на специальную рампу и только потом останавливаются диски.При такой системе парковки головки не изнашиваются от данного действия и поводов для паники нет.У хитачи нет никаких физических причин для жесткого ограничения на старты и стопы, примерно как у CD-ROM :D.

    А вот у других производителей - где как.У многих других головки тупо садятся на внутреннюю часть диска, вот в этом случае да, останов дисков неизбежно приводит к пропаданию воздушной подушки и голова некоторое время трется о диск пока он не остановится.Для таких дисков частое щелкание питания и правда вредно и может привести к преждевременной кончине.

    ОтветитьУдалить
  21. 2Чуг
    Заземлятся надо, без заземления высока вероятность убить винты статикой

    ОтветитьУдалить
  22. > А ваше время .... - тоже расходный материал?
    А какие предлагаются варианты? Забить на всё и регулярно терять данные при смерти винчестеров? Думаю, не самый лучший вариант. Ну да, я потратил немного лишнего времени в инсталляторе Debian, чтобы сконфигурировать где RAID1, где RAID5, да, скрипт для бэкапов. Я считаю эти потери оправданными. В случае смерти винтов у меня есть хорошие шансы не потерять данные и быстро вернуться к нормальной работе. Для меня это важно.

    > Да и бэкапы не каждые 5 минут
    > делаются.Потери данных неизбежно будут.
    > И это может быть неприятно.
    Никто и не обещает 100% сохранности всех текущих данных в бэкапе. Это, опять же, не самое страшное, надо просто это понимать.

    ОтветитьУдалить
  23. Да, кстати, помимо времени есть такой расходный материал как нервы. У меня в прошлом ноуте трижды винты дохли, очень неприятный момент, скажу я вам. И настольных винчестеров дохлых и умирающих я насмотрелся достаточно. Вот теперь, да, я потратил время на всю эту конфигурацию, но чувствую себя куда как спокойнее. Это тоже дорогого стоит.

    ОтветитьУдалить
  24. 2 Роман Химов пишет...
    Таких сейчас несколько моделек есть с двумя винчестерами.
    Я большой любитель портативной техники - компактной, без ручек :-)

    Кстати, единственный момент, который здесь меня озадачил, так это связь (а точнее, вроде как, отсутвие её) количества включений/выключений и смертности.
    Это не совсем так. От количества старт-стоп циклов мрут старики. Как тут правильно сказали, чтение-запись происходят бесконтактно, а механика там более или менее надёжная.

    Чисто с физической точки зрения тоже логично, раскручивание, нагрев, охлаждение, нехорошие переходные процессы, должны влиять.
    На стариков - да. На новых винчестерах с этим должна справляться термокалибровка.

    2 Чуг пишет...
    так вот, сказюки, которые проработали десять лет без сбоев просто начинают сыпаться, когда приносиш их на рабочее место
    Такие винчестеры уже нельзя останавливать - рассыпятся :-)

    а вобще ощущение такое, что они как растения: либо приживаются и растут либо быстро погибают
    Вроде того. Гугловцы говорят так: либо диск сдохнет в первые 2-3 месяца, либо через 2-3 года и дальше от износа механики.

    2 givchik пишет...
    у производителей винчестеров очень большая конкуренция. Кто веник продаст побольше объемом да подешевле.
    Подозреваю, что SMART был создан как раз по этим причинам - чтобы меньше возвратов было.

    ОтветитьУдалить
  25. ===
    [13] user@host ~ sudo camcontrol defects 0:0:0 -f phys -G
    Got 1 defect:
    9878:9:230
    [14] user@host ~
    ===

    И торчит этот блок в GDC уже девятый год. ;) Всё-таки, нативная "Альфа", собранная в Глазго, неубиваема. :)

    ОтветитьУдалить
  26. 2 Анонимный пишет...

    1 Raw_Read_Error_Rate 100 100 046 84993

    2 Throughput_Performance 100 100 030 27394048

    3 Spin_Up_Time 100 100 025 1

    4 Start_Stop_Count 099 099 000 1121

    5 Reallocated_Sector_Ct 100 100 024 8589934592000

    7 Seek_Error_Rate 100 100 047 2602

    Кхм... (подавился чаем) Это... самое... бекапы они того... уже громко стучат сапогами :-)

    Я так понимаю мой винт на том свете фонарями ищут...
    - "Доктор, куда мы едем?"
    - "В морг!"
    - "Доктор, так я ж ещё не умер!"
    - "А мы ещё не приехали" :-))

    2 kot пишет...
    Заново перекачивать - это излишне.
    Да я знал, просто сгоряча рубанул.

    2 MistiQ пишет...
    Не понимаю истерии, как правильно заметили выше винты и правда расходный материал.
    Они дешевы, поэтому вылетел винт - да и фиг с ним...

    Ещё раз: у меня он на ноутбуке, и вот так легко и просто заменить не удастся. И потом, это минимум 5000 руб, которые на дороге в общем не валяются.

    2 JohnSmith пишет...
    > Количество перемещений отражает износ поверхности
    Это неверно.У HDD нет особых причин для износа поверхности - головы над ней парят на вохдушной подушке.

    Я не это имел в виду. С течением времени, температурных изменений и количества чтений скрытые дефекты поверхности имеют свойство проявляться в виде сбойных участков.

    2 JohnSmith пишет...

    > Возможно повреждение поверхности при таких отключениях.
    У нормально спроектированных дисков ничего такого не возможно, всю жизнь HDD отрубаются без оповещения о данном факте потому как особенности схемы питания в PC.

    Ну, я диски не проектирую, потому ручаться не могу. Вам виднее.

    2 Vasya Pupkin пишет...
    Сигейт нынче замечен в ХАЛЯВЕ.
    Так, ребята, давайте не будем распаляться. Ошибки бывают у всех производителей - но раз пошли такие заявления, хорошо бы ссылочку кинуть. А то сюда нагрянут сигейтовцы и у меня за дверью застучат сапогами :-)

    По сигейтам сейчас большой процент возвратов и обращений в гарантийки.
    Откуда данные, если не секрет?

    2 undefined_opcode пишет...
    Кстати о гвалте, убунте и том ноуте с диском от хитачи.
    Кстати, истерику там подняли капитальную. Причём без выяснения причин и проч.

    Хитачевцы пользуются собственной фирменной системой парковки голов.
    Там истерика была по другому поводу: видите ли, винты дохнут от включённого режима энергосбережения. И дескать это заговор против убунту. У меня тоже включён этот режим на ноуте в Дебиан - и что!?

    У многих других головки тупо садятся на внутреннюю часть диска
    Вы это серьёзно!? А считывающая головка от одного соприкосновения выживет? Ссылочку, пожалуйста, на такие "технологии".

    2 Анонимный пишет...
    Заземлятся надо, без заземления высока вероятность убить винты статикой
    Ай, что вы, право, в самом деле... тут народ бекапов не делает, а вы статика :-)

    2 Роман Химов пишет...
    > А ваше время .... - тоже расходный материал?
    А какие предлагаются варианты?

    Друзья, не распаляйтесь. Я понимаю, тема очень живая, но всё-таки.

    ОтветитьУдалить
  27. У меня работают:
    - Conner 400 mb (!) (в качестве загрузочного (/boot) на машине, где биос не поддерживает современные винты)
    - Seagate 700 Mb
    - IBM Deskstar 6.4 GB
    И ничего...

    Далее, не путает ли рассказчик
    5 Reallocated_Sector_Ct 0x0033 100 100 005 Pre-fail Always - 0
    и
    196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 6
    Ивент - это ивент, а сектор - это сектор... "Пятеро", "шестеро"... Ага...

    ОтветитьУдалить
  28. Материал хорош, с комментариями чуть похуже, но, более всего, радует сам факт поста на эту тему. На фоне дебатов-то по поводу DE и дистрибутивов (про lin vs. win, я уж не вспоминаю).

    Best Regards. Thanx.

    ОтветитьУдалить
  29. Кстати, вот был подкаст тов. Гибсона на тему винчестеров:
    http://www.grc.com/sn/SN-081.htm

    ОтветитьУдалить
  30. Вот прогрес по накопителям движется в сторону flash уже есть модели по 64 Гектара. Для ноутбука ето самое то. Вес, Скорость, Энергопотребление.
    Только цена высока! Но это времено

    ОтветитьУдалить
  31. Вот прогрес по накопителям движется в сторону flash уже есть модели по 64 Гектара. Для ноутбука ето самое то. Вес, Скорость, Энергопотребление.
    Только цена высока! Но это времено

    ОтветитьУдалить
  32. Да вроде и по 500GB уже есть...
    http://catalog.sunrise.ru/_goodsdesc/goodsdesc.php?code=8132935

    ОтветитьУдалить
  33. Блин, у меня:
    192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 309
    нифига не 2...

    и за всё время было 3 непонятных ошибки "Error: ICRC, ABRT 1 sectors at LBA..."

    ОтветитьУдалить
  34. Для Анонимного
    Уже есть и вовсю торгуют Iomega 1T передача по USB. Махина я вам скажу убийственная. Скорость приличная. А сам из металла. Когда заводится думается взлетает. Это так к слову о доступных обьемах для простых пользователей

    ОтветитьУдалить
  35. 2 Анонимный пишет...
    У меня работают:
    - Conner 400 mb

    Эээ, батенька... ну вы и сравнили. Тогда и небо было голубее, и трава зеленее :-) Эти будут служить долго, а вот современные - год-два и на свалку.

    Далее, не путает ли рассказчик
    Сначала перемещений было 5 и 1 текущий, потом 6 и 0 текущих. Путаницы особой нету.

    Ивент - это ивент, а сектор - это сектор...
    Ну так перемещение состоялось, стало быть, сектор сбойный. Если ув.тов. Анонимус обладает широкими познаниями в этой области, просьба их сюда отгрузить :-)

    ОтветитьУдалить
  36. Замечательная статья! Вот только с Рейдами на ноутах плохо, приходится бэкапиться на настольную машину, что в принципе тоже не смертельно %)

    ОтветитьУдалить
  37. Тут было высказано отличное предложение. На ноуте насраивается зеркало с усб диском (средствами raid (mdadm) или lvm).
    После синхронизации рейда, диск отключается. И убирается на полку - бэкап. Когда домой приходишь - подключаешь и зеркало синхронизируется. Не совсем рейд и не совсем бэкап, но в целом неплохо.

    ОтветитьУдалить
  38. Кстати, в том же отчёте Google.Labs (со слов КТ) вопросы про надёжность RAID 5 поставлены под сомнения. У них получалось, что второй диск тоже с высокой вероятностью выйдет из стоя. М.б. потому что диски для RAID 5 у них брались одинаковые из одной партии?

    ОтветитьУдалить
  39. Я бы сказал, что если HDD правильно питается, работает при вменяемых условиях эксплуатации (не в печи/холодильнике и не на вибростенде), то и ломаться у него оснований вроде бы нет. Вроде бы...

    ОтветитьУдалить
  40. > вопросы про надёжность RAID 5 поставлены
    > под сомнения. У них получалось, что второй диск
    > тоже с высокой вероятностью выйдет из стоя.
    Сильно зависит от числа дисков в массиве, вряд ли вы дома будете собирать массив хотя бы с десятком дисков. Плюс, именно поэтому важно иметь лишний диск на горячую замену. Действительно бывает так, что диски одной партии ломаются с разницей в несколько суток (несколько часов всё же значительно реже, да и такая падучая тоже нечаста), этого времени должно хватить для ввода в строй заранее припасённого винчестера. Ну и желательно тут же новый на замену приобрести. :)

    Можно, конечно, RAID6 забабахать, но это значительно тормознее, да и как показывают другие исследования, ненамного лучше. Актуальнее наличие дисков и быстрая замена в RAID5, тем более, на небольших массивах.

    ОтветитьУдалить
  41. спасибо за статью,

    здорово было бы перейти на matrix raid (инфа на вике)

    ОтветитьУдалить
  42. "Если про чтении информации..."
    очевидно s/про/при

    ОтветитьУдалить
  43. Скажите, так есть ли основания для убунту-истерии? Прошу прощения за корыстные цели в комментариях, просто врядли я ещё где-нибудь найду такое количество специалистов в данной области в одном месте :)

    ОтветитьУдалить
  44. > Ещё раз: у меня он на
    > ноутбуке, и вот так легко и
    > просто заменить не удастся.

    Ммм, на ноутбуке винт меняется чуть ли не проще, чем на стационарнике. Отворачиваются два винта сбоку корпуса и винчестерая корзинка спокойно вытягивается за хвост.

    > И потом, это минимум 5000
    > руб, которые на дороге в
    > общем не валяются.

    Ммм. Мне на днях купленная 160ка обошлась в два раза дешевле. И это ещё я брал её в салоне с изрядной наценкой.

    > У меня тоже включён этот
    > режим на ноуте в Дебиан - и
    > что!?

    Я его выключил (точнее снёс напрочь laptop-detect, что его инициировал). Ибо портит-нет не знаю, но звуки постоянно стопающегося/раскручивающегося винта мне совсем не понравились.

    ОтветитьУдалить
  45. 1 Raw_Read_Error_Rate 0x000f 074 070 034 Pre-fail Always - 163755619
    3 Spin_Up_Time 0x0003 070 070 000 Pre-fail Always - 0
    4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 250
    5 Reallocated_Sector_Ct 0x0033 098 098 036 Pre-fail Always - 81
    7 Seek_Error_Rate 0x000f 084 060 030 Pre-fail Always - 331876493
    9 Power_On_Hours 0x0032 082 082 000 Old_age Always - 16014
    10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
    12 Power_Cycle_Count 0x0032 098 098 020 Old_age Always - 2050
    194 Temperature_Celsius 0x0022 035 052 000 Old_age Always - 35
    195 Hardware_ECC_Recovered 0x001a 074 070 000 Old_age Always - 163755619
    197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 1
    198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 1
    199 UDMA_CRC_Error_Count 0x003e 200 189 000 Old_age Always - 60
    200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline - 0
    202 TA_Increase_Count 0x0032 234 131 000 Old_age Always - 122


    В морг говорите?

    ОтветитьУдалить
  46. 2 энерджи пишет...
    Замечательная статья! Вот только с Рейдами на ноутах плохо
    Я даже слабо представляю это в своём случае :-)

    2 GQ пишет...
    На ноуте насраивается зеркало с усб диском (средствами raid (mdadm) или lvm).
    8-[]
    Ничего себе... я просто по scp скидываю важные данные на десктоп и всё.

    2 Анонимный пишет...
    Я бы сказал, что если HDD правильно питается, работает при вменяемых условиях эксплуатации (не в печи/холодильнике и не на вибростенде), то и ломаться у него
    ... есть все шансы, причём очень большие - в первые три-шесть месяцев :-) Лоровская привычка "по ссылкам не ходить" тут не прокатывает :-)

    2 Sereg@ пишет...
    "Если про чтении информации..."
    очевидно s/про/при

    Ага, спасибо за багфикс.

    2 Sereg@ пишет...
    Скажите, так есть ли основания для убунту-истерии?
    Минимальные. Если диск помрёт, то от этого - в последнюю очередь.

    врядли я ещё где-нибудь найду такое количество специалистов в данной области в одном месте :)
    На опеннете. Там "крутые профессионалы", которым лениво писать такие статьи.

    2 Nikolay пишет...
    Ммм, на ноутбуке винт меняется чуть ли не проще, чем на стационарнике. Отворачиваются два винта сбоку корпуса и винчестерая корзинка спокойно вытягивается за хвост.
    На моей модели такого нет. Вы что-то путаете. У меня есть серьёзные сомнения, что он там просто прикручен на винты.

    Ммм. Мне на днях купленная 160ка обошлась в два раза дешевле. И это ещё я брал её в салоне с изрядной наценкой.
    Хмм... посмотрю. Видно, у меня прайс прадедовский :-)

    Я его выключил (точнее снёс напрочь laptop-detect, что его инициировал). Ибо портит-нет не знаю, но звуки постоянно стопающегося/раскручивающегося винта мне совсем не понравились.
    Я их не слышу, но просто отключил это в hdparm.conf и всё.


    06.11.2007 17:45:00

    ОтветитьУдалить
  47. > На моей модели такого нет. Вы
    > что-то путаете.

    Верно, я не в курсе особенностей вашей модели. Про свою не путаю, замена винчестера тут будет быстрее, чем в стационарнике (свинтить два винта с снять крышечку, вытянуть за хвост корзинку, свинтить винт с корзинки, привинтить новый, задвинуть в корпус, завинтить — у меня это занимало пару минут). Старый уже Nec versa S940. Думал в современных и менее компактных моделях всё ещё лучше. Или у вас 10-12-дюймовая модель?

    > У меня есть
    > серьёзные сомнения, что он там
    > просто прикручен на винты.

    Нет, он прикручен к корзинке. Которая вообще никуда не прикручена и держится исключительно на трении с IDE-разьёмом, куда воткнута. Снаружи его прикрывает небольшая крышка: справа-снизу на http://www.3dnews.ru/documents/9990/09.jpg

    В моём стационарнике всё точно так же, но больше. И крышка и корзинки и винты. Потому, диск в стационарнике поменять существенно дольше будет.

    ОтветитьУдалить
  48. Только что сдох Сигейт 80 гигов SATA. Уже семь лет считаюСигейты полным говном; не зря. WD рулят.

    ОтветитьУдалить
  49. Logichno predpolozhit chto vint avtora umer ot 44 loads/unloads golovki v chas => ubuntu-isteriya rulit :)

    ОтветитьУдалить
  50. У меня новый ноут и тоже встречаются крупные цифры в выводе smartctl. например:
    Reallocated_Sector_Ct 100 100 024 8589934592000

    точно то же самое тут уже проскакивало. один в один.
    винт хитачи.
    не может быть таких крупных чисел в смарт.
    а вот если взять это число (8589934592000) в hex, то получается 7D000000000.
    Так что кто-то ошибается, либо smartctl либо хитачи.

    ОтветитьУдалить
  51. Спасибо за статью!!!
    (Цитата) Также регламентируется максимальный градиент нагрева – изменение температуры накопителя не должно превышать 20 градусов в час
    Не значит ли это, что по хорошему корзину с HDD надо помещать в термостат?

    ОтветитьУдалить
  52. Хочу похвалить Хитачи 500 гигов, достаточно тихие и тьфу, тьфу, тьфу...
    А вообще, у меня бэкап всего, что на винтах, лежит на DVD. 1,5 террабайта на болванках - это жесть.
    Яйца храню в разных лукошках.

    ОтветитьУдалить
  53. Извините за анонимность. Крутов Дмитрий.
    Спасибо огромное за замечательный обзор. Хочу добавить, что навесные средства охлаждения также могут явится источником вибрации. Особенно это касается тех случаев, когда комп работает сутками в закрытом помещении. Если вентилятор охлаждения при этом вдруг начнет шуметь, что вибрация передатеся и на винт. Таким образом у меня почти на глазах сдох один из пары совершенно новых винтов. Представляете - сначала задребезжал вентилятор, и уже через 5 минут появилось сообщение об ошибке отложенной записи...

    ОтветитьУдалить
  54. Михаил, огромное спасибо за такой глубокий материал. Очень полезная информация.

    ОтветитьУдалить
  55. Гнусмас SP1614N Reallocation Event Count показывает значение 5088...винда грузится нормально раза с пятого...диск С я уже потерял...попытаюсь переехать на др.раздел....не знаю на сколько еще его хватит....

    ОтветитьУдалить
  56. Разьве WD и SeaGate не одно и тоже?

    ОтветитьУдалить
  57. Купил года три назад два винта по 500 г. хитачи. Одна партия, и время установки в стационар (т.е.) время эксплуатации.Температура во время эксплуатации, примерно 35 (активное охлаждение) Один уже умирает. (посмотрел смарт) там написало что здоровье 94 процента. Думаю поверить ему на слово. Изначально заметил характерные щелчки. Сейчас на нём только система. Происходящие глюки не передать словами. Радует только одно. С данного винта успел снять всё,что было нужно. Сейчас там только система. Если слетит - не сильно обижусь:)

    ОтветитьУдалить
  58. За все время владения домашними компьютерами (более 12 лет) статистика отказов такая:
    Первый винт SEAGATE 2003 года умер в 2004 году почти сразу же. SMART был просто ужасный, менее 75% через полгода использования.
    Затем SAMSUNG 3шт от 2004 до 2008 года выпуска сдохли после того, как потаскал в съемных боксах (диски было не жалко, т.к. их объема уже не хватало).
    Затем 2 WD зеленой серии 2010 года. Сдохли через 3 месяца от выгорания контроллера по причине того, что я их подключил на одну линию с дополнительными питанием видеокарты - не выдержал БП.
    Начиная с 2010 года около 10 дисков WD черной, красной серии - все исправно работают.
    Начал щелкать ветеран SAMSUNG 2009 года, купил ему на замену WD черной серии по аховой цене 2014 года. Сразу из коробки этот жиск оказался неисправен, скоро понесу по гарантии.

    ОтветитьУдалить