Оценка надежности накопителей, установленных в настольных компьютерах и бытовых электронных устройствах
Введение
Устройства хранения информации на жестких дисках традиционно устанавливались главным образом на настольных компьютерах, однако в последнее время накопители все чаще находят применение и в бытовой электронике. В настоящей статье описываются способы оценки надежности накопителей, установленных в настольных компьютерах и бытовых электронных устройствах, с использованием результатов стандартных лабораторных испытаний компании Seagate.
Определения
Под наработкой на отказ Seagate подразумевает отношение времени РОН (Power-On Hours — время в часах, в течение которого накопитель находился во включенном состоянии) в течение года к усредненной интенсивности отказов AFR (Annualized Failure Rate — годовая интенсивность отказов) за первый год. Такой метод дает достаточную точность при малом количестве отказов, поэтому мы используем его для расчета наработки на отказ «первого года». Усредненная годовая интенсивность отказов для накопителя рассчитывается на основе данных о времени безотказной работы, полученных в ходе испытаний RDT (Reliability-Demonstration Test — демонстрационные испытания надежности). По той же методике проводятся и заводские испытания FRDT (Factory Reliability-Demonstration Test — заводские демонстрационные испытания надежности), однако здесь проверяются серийные накопители из производственных серий. В рамках настоящего документа мы будем исходить из того, что любая концепция, применимая в отношении RDT, справедлива также и для FRDT.
Испытания на надежность, проводимые Seagate
В Группе персональных устройств хранения Seagate со штаб-квартирой в г. Лонгмонт (шт. Колорадо) испытания накопителей для настольных систем на надежность обычно проводятся в термокамерах при температуре окружающей среды +42 градуса по Цельсию, что повышает интенсивность отказов. Кроме того, накопители при этом эксплуатируются с максимально возможной продолжительностью включения (под продолжительностью включения дисковода понимается количество поисков данных, их считывания и записи в течение заданного отрезка времени). Это делается для того, чтобы выявить как можно больше причин отказа еще на стадии разработки изделия. Устранив проблемы, отмеченные на этом этапе, мы можем быть уверены, что наши пользователи с ними больше не столкнутся.
Оценка параметров по Weibull
Предположим, что испытанию RDT были подвергнуты 500 накопителей, каждый из которых проработал 672 часа при температуре окружающей среды 42°С. Допустим также, что в ходе испытания было отмечено три отказа (после 12, 133 и 232 часов работы). Это означает, что из 500 проверенных накопителей успешно прошли испытание 497. Для анализа и экстраполяции полученных результатов мы применяем моделирование по Weibull, используя для этого пакет программ SuperSmith фирмы Fulton Findings1. В частности, с помощью метода максимального правдоподобия производится оценка таких параметров распределения Weibull, как бета (форм-фактор) и эта (масштабный коэффициент).
(То есть априори предполагается, что отказы распределены согласно Weibull. Для тех, кто знаком с математической статистикой, приведу формулу плотности вероятности для этого распределения:
Смысл проводимых испытаний — оценить параметры распределения. При этом считается, что при заданном значении бета параметр эта равен времени в часах, за которое выйдут из строя 90% тестируемых накопителей. (Обсуждение данной математической модели требует серьезных познаний в математической статистике и выходит за рамки данной статьи, поэтому предлагается принять ее как факт) — прим. редактора).
Если в ходе испытания отмечено пять или менее отказов, точно определить параметр бета по полученным данным невозможно. Поскольку такие результаты испытаний встречаются довольно часто, мы анализируем их с помощью метода WeiBayes2, в основу которого положена оценка параметра бета по статистическим данным. В лаборатории продукции для настольных компьютеров мы сейчас принимаем бета = 0,55. Такое значение получено на основе производственных данных, представленных ниже в таблице. Она составлена на основании испытания всех накопителей для настольных систем, прошедших проверку до марта 1999 г.
Место производства накопителей | База данных | Среднее значение бета | Стандартное отклонение бета |
---|---|---|---|
Лонгмонт | 37 RDT, 5 FRDT | 0,546 | 0,176 |
Пераи | 2 RDT, 4 FRDT | 0,617 | 0,068 |
Вузи | 1 RDT | 0,388 | нет данных |
Обобщенные данные по настольным системам | 49 испытаний | 0,552 | 0,167 |
Приведенный ниже график отображает результаты анализа Weibull и WeiBayes. Сплошная линия соответствует параметрам бета и эта по Weibull (бета = 0,443, эта = 69 331 860), рассчитанным по методу MLE (Maximum Likelihood — максимальное правдоподобие)3 всего для 3 отказов на 500 накопителей. Как уже отмечалось, такие результаты считаются не столь точными, как полученные по методу WeiBayes для небольшой интенсивности отказов.
Результаты, полученные методом WeiBayes (для бета = 0,55), представлены на графике пунктирной линией. Поскольку 672 часа работы при температуре 42°С для испытания RDT вполне достаточно, мы использовали свой внутренний параметр «доверительная вероятность прекращения испытаний»4, который для анализа WeiBayes принят равным 63,2%. Расчет по методу WeiBayes показал, что при температуре 42°С и статистическом значении бета = 0,55 приемлемое значение эта составляет 3 787 073 часа.
Легенда к графику «Примеры анализа по методам Weibull и WeiBayes»
W/mle = Доверительная вероятность прекращения испытаний
WeiBayes fit = Аппроксимация WeiBayes
Observed Weibull fit via MLE = Аппроксимация данных исследования по Weibull методом максимального правдоподобия
Eta = эта
Beta = бета
n/s = (всего/исправных накопителей)
Следующий этап анализа состоит в пересчете параметра эта, полученного в результате тестов при 42°С, в значение, соответствующее нашей стандартной рабочей температуре (25°С). Опираясь на модель Arrhenius5, для учета температурных различий можно принять коэффициент учащения отказов равным 2,2208. Таким образом, значение эта для 25°С (эта25) будет равным значению этого параметра для 42°С (эта42), умноженному на 2,2208, то есть, 8 410 332 часа.
Оценка среднего времени наработки на отказ в течение первого года на основании параметров Weibull
На основании параметров бета и эта Weibull, полученных после температурной коррекции, в любой момент можно рассчитать суммарный процент отказов. Чтобы оценить процент накопителей, которые могут выйти из строя при температуре 25°С в промежутке времени от t1 до t2, достаточно произвести вычитание значений суммарного процента отказа в моменты t1 и t2, а затем воспользоваться соответствующими значениями бета и эта25.
Для оценки усредненной интенсивности отказов (параметр AFR) за первый год эксплуатации накопителя, установленного в настольном компьютере, примем, что у пользователя устройство находится во включенном состоянии 2 400 часов в год. Допустим также, что еще 24 часа оно эксплуатировалось на заводе на этапе интеграции. Поскольку все накопители, вышедшие из строя в течение этого периода, возвращаются в Seagate и к конечному пользователю не попадают, при расчете AFR и наработки на отказ за первый год они не учитываются.
С учетом приведенного выше (продолжительность включения 100%, эта25 = 8 410 332 час, бета = 0,55 и общее время работы за год 2 400 час) относительную интенсивность отказов за первый год можно рассчитать как интенсивность отказов, произошедших в период между 24 час (t1) и 2 424 час (t2). Результаты такого расчета приведены ниже в таблице, построенной на основе наработки на отказ в течение первого года и данных, полученных в ходе испытаний RDT.
Исходные данные: 2 400 час/год | |
---|---|
Форм-фактор по Weibull (бета): | 0,55 |
Масштабный коэффициент по Weibull (эта): | 8 410 332 |
Р(отказов) от 0 до 2 400 час/год: | 1,123% |
Р(отказов) от 0 до 24 час: | 0,089% |
| |
AFR за первый год | 1,0338% (до округления) |
Наработка за год: | 2 400 час |
AFR за первый год: | 0,010338 |
| |
Наработка на отказ за первый год по Weibull: | 232 140 час |
(Р(отказов) вычисляются на основании распределения Weibull — см. график. Далее понятно: Наработка на отказ за первый год = Наработка за год / AFR за первый год — прим. редактора).
Учет реальных условий использования
Как показывают приведенные выше расчеты, если накопитель используется при температуре 25°С и находится во включенном состоянии 2 400 часов в год, можно ожидать, что при работе у пользователя средняя наработка на отказ составит 232 140 часов. Однако такие условия соблюдаются в бытовой электронике не всегда. В некоторых бытовых приборах, скажем, накопитель может работать почти непрерывно, поэтому время его работы за год намного превысит 2 400 часов. В других же устройствах, например, игровых видеоприставках, этот показатель может оказаться значительно ниже. В последующих разделах описано, как именно можно скорректировать расчетное значение наработки на отказ для различной интенсивности использования, продолжительности включения и окружающей температуры.
Интенсивность использования
Учесть изменения средней наработки на отказ, вызванные различиями в интенсивности использования накопителя, можно с помощью приведенного графика.
Легенда к графику «Коррекция среднего времени наработки на отказ в зависимости от ожидаемого времени работы накопителя за год»
Название вертикальной оси — Корректирующий множитель для наработки на отказ
Название горизонтальной оси — Ожидаемое время работы накопителя за год
Например, если известна наработка на отказ для 2 400 рабочих часов в год, а реальное рабочее время за год составляет 8 760 часов, то среднее время наработки на отказ снизится примерно вдвое. И наоборот: когда накопитель работает мало, как это бывает в некоторых игровых видеоприставках, то наработка на отказ может почти удвоиться.
Температура
Теперь давайте посмотрим, как изменяется время наработки на отказ при повышении рабочей температуры. Для построения графика температурного коэффициента времени наработки на отказ можно применить ту же модель Arrhenius, которую мы использовали для определения коэффициента учащения отказов. Представленная ниже таблица показывает, как снижается наработка на отказ за первый год (если продолжительность включения составляет 100%) при температуре окружающей среды выше 25°С.
Температура, °С | Коэффициент учащения отказов | Температурный коэффициент снижения времени наработки на отказ | Скорректи- рованное время наработки на отказ |
---|---|---|---|
25 | 1,0000 | 1,00 | 232 140 |
26 | 1,0507 | 0,95 | 220 533 |
30 | 1,2763 | 0,78 | 181 069 |
34 | 1,5425 | 0,65 | 150 891 |
38 | 1,8552 | 0,54 | 125 356 |
42 | 2,2208 | 0,45 | 104 463 |
46 | 2,6465 | 0,38 | 88 123 |
50 | 3,1401 | 0,32 | 74 284 |
54 | 3,7103 | 0,27 | 62 678 |
58 | 4,3664 | 0,23 | 53 392 |
62 | 5,1186 | 0,20 | 46 428 |
66 | 5,9779 | 0,17 | 39 464 |
70 | 6,9562 | 0,14 | 32 500 |
Как видно из таблицы, по мере роста окружающей температуры температурный коэффициент снижения времени наработки на отказ и скорректированная наработка на отказ значительно сокращаются. Так, при 42°С коэффициент учащения отказов составляет 2,2208 (как и было определено в ходе настоящего анализа ранее). А коэффициент коррекции времени наработки на отказ для этой же температуры равен 0,45, то есть среднее время наработки на отказ при температуре 42°С оказывается в два с лишним раза меньше, чем при температуре 25°С.
Продолжительность включения
Продолжительность включения большинства накопителей, установленных в персональных компьютерах, составляет от 20 до 30%, тогда как в бытовых электронных устройствах этот показатель может быть выше или ниже. Измерив объем данных, который пересылается внутри современных устройств бытовой электроники за сутки, специалисты Seagate установили, что продолжительность включения накопителей в них составляет всего 2,5%.
Чтобы определить, как изменяется наработка на отказ при продолжительности включения 2,5% по сравнению со 100% (такое значение характерно для испытаний RDT), нужно выяснить, какое влияние на этот процесс оказывают те компоненты накопителей, состояние которых зависит от продолжительности включения, а какое — другие его элементы. Количество зависимых компонентов в накопителе прямо пропорционально количеству пластин жестких дисков в нем. Взаимоотношение между числом жестких дисков и усредненной интенсивности отказов за первый год отображено на следующей иллюстрации. Пространство под пунктирной линией на этом графике соответствует «базовой», — то есть, не зависящей от того, как долго работает устройство, — интенсивности отказов гипотетического накопителя с нулевым количеством жестких дисков (или накопителя, который не производит чтения, записи и поиска информации). Сплошной линией отмечена ожидаемая интенсивность отказов как функция количества жестких дисков.
Легенда к графику «Зависимость общей и базовой усредненной интенсивности отказов от количества жестких дисков в накопителе»
Название вертикальной оси — Нормализованное значение AFR
Название горизонтальной оси — Количество пластин жестких дисков (не более 4)
Total AFR = Общая усредненная интенсивность отказов
Base AFR = Базовая усредненная интенсивность отказов
Как видно из графика, уменьшение продолжительности включения снижает количество только тех отказов, которые связаны со временем работы накопителя (пространство между пунктирной и сплошной линиями). Зная соотношение между количеством отказов, зависящих от продолжительности включения, и их общим числом, можно оценить влияние продолжительности включения на усредненную интенсивность отказов AFR. Так, для накопителя с четырьмя жесткими дисками общая интенсивность отказов составит 1,4%, а базовая — 0,6%. Снижение продолжительности включения уменьшит вероятность отказа на [(1,4 — 0,6)/1,4] = 57%. Таким образом, снижая время работы четырехдискового накопителя, мы можем уменьшить вероятность отказа только на 57%, остальная доля неполадок от продолжительности включения не зависит.
Изменение коэффициента наработки на отказ для накопителей с разным количеством жестких дисков представлено на следующем графике.
Легенда к графику «Зависимость коэффициента наработки на отказ от продолжительности включения накопителя и количества жестких дисков в нем»
Название вертикальной оси — Коэффициент наработки на отказ
Название горизонтальной оси — Продолжительность включения
1-disk… = Для дисковода минимальной емкости с 1 жестким диском
2-disk… = Для дисковода с 2 жесткими дисками
3-disk… = Для дисковода с 3 жесткими дисками
4-disk… = Для дисковода максимальной емкости с 4 жесткими дисками
Комплексный учет нескольких факторов
Продолжая анализ, оценим комбинированное воздействие различных значений продолжительности включения и температурных коэффициентов сокращения наработки на отказ для нескольких накопителей. На графике внизу слева представлены коэффициенты коррекции наработки на отказ для накопителя высокой емкости с 4 жесткими дисками при разных комбинациях продолжительности включения и температуры окружающей среды. Рисунок справа отображает такие же коэффициенты для накопителя, оснащенного только одним жестким диском. Как видно из этих графиков, в зависимости от продолжительности включения и рабочей температуры накопителя, установленного в ПК, эффективная наработка на отказ за первый год может оказаться выше, равной или ниже, чем ожидаемое значение этого параметра, рассчитанное по результатам заводских испытаний. При этом на накопителе с одним жестким диском изменение продолжительности включения и окружающей температуры сказывается слабее, а коэффициенты коррекции здесь значительно меньше.
Легенда к графикам «Снижение времени наработки на отказ в зависимости от температуры и продолжительности включения (для накопителя максимальной емкости с 4 жесткими дисками/минимальной емкости с 1 жестким диском)»
Название вертикальной оси — Коэффициент снижения времени наработка на отказ
Название горизонтальной оси — Окружающая температура, °С
DF@100%. .. = Продолжительность включения = 100%
DF@30%… = Продолжительность включения = 30%
DF@20%… = Продолжительность включения = 20%
DF@10%… = Продолжительность включения = 10%
DF@5%… = Продолжительность включения = 5%
DF@1%… = Продолжительность включения = 1%
Надежность после первого года эксплуатации
Согласно распределению Weibull, описывающему зависимость наработки на отказ от срока эксплуатации, при значении бета меньше единицы вероятность отказов оборудования со временем снижается. По этой причине интенсивность отказов накопителей на первом году эксплуатации должна быть выше, чем в последующие годы. Но какова будет интенсивность отказов или среднее время наработки на отказ, если усреднить эти показатели за все время эксплуатации накопителя? Ниже приведены три метода оценки надежности, позволяющие ответить на этот вопрос.
- Можно с помощью анализа Weibull (бета, эта25) оценить количество возможных отказов после первого года эксплуатации. Однако для этого потребовалось бы получить дополнительные данные демонстрационных испытаний надежности, увеличив длительность самих испытаний на порядок или больше. Такой подход едва ли можно признать целесообразным.
- Можно использовать информацию о гарантийном обслуживании из базы данных Seagate. Она позволит оценить соотношение накопителей, возвращенных на втором и третьем году эксплуатации, и устройств, в которых возникли сбои в течение первого года. Однако такие данные имеются только за первые три года эксплуатации — именно на этот срок распространяется действие большинства гарантийных обязательств Seagate на накопители для настольных компьютеров. Правда, серьезным преимуществом этого подхода является то, что все данные относятся исключительно к продукции Seagate для настольных систем.
- Можно принять так называемую «плоскую» модель, предполагающую, что после завершения первого года эксплуатации интенсивность отказов остается на постоянном уровне. Это означает, что во все годы после первого интенсивность отказов будет такой же, как и на втором году эксплуатации. Поскольку вероятность отказа со временем уменьшается, данный метод дает осторожную оценку средней наработки на отказ для всего срока эксплуатации.
Сравнение всех трех моделей приведено в таблице ниже.
МОДЕЛЬ: | |||||||
---|---|---|---|---|---|---|---|
Weibull | По данным гарантийного обслуживания (только по OEM) | »Плоская» модель | |||||
Год эксплу- атации | Суммарная продолжи- тельность включения (час) | Интен- сив- ность отказов за год | Суммар- ная интенсив- ность отказов | Интен- сив- ность отказов за год | Суммар- ная интенсив- ность отказов | Интен- сив- ность отказов за год | Суммар- ная интенсив- ность отказов |
1 | 2 400 | 1,20% | 1,20% | 1,20% | 1,20% | 1,20% | 1,20% |
2 | 4 800 | 0,55% | 1,75% | 0,78% | 1,98% | 0,55% | 1,75% |
3 | 7 200 | 0,43% | 2,18% | 0,39% | 2,37% | 0,55% | 2,30% |
4 | 9 600 | 0,37% | 2,55% | 0,55% | 2,86% | ||
5 | 12 000 | 0,33% | 2,88% | 0,55% | 3,41% | ||
6 | 14 400 | 0,30% | 3,18% | 0,55% | 3,96% | ||
7 | 16 800 | 0,28% | 3,46% | 0,55% | 4,51% | ||
8 | 19 200 | 0,26% | 3,72% | 0,55% | 5,06% | ||
9 | 21 600 | 0,24% | 3,96% | 0,55% | 5,62% | ||
10 | 24 000 | 0,23% | 4,19% | 0,55% | 6,17% |
Чтобы нагляднее продемонстрировать различия между моделями, мы приводим график суммарной относительной интенсивности отказов, построенный на основании каждой из них (время наработка на отказ для первого года эксплуатации принято равным 200 000 часов).
Легенда к графику «Суммарная годовая интенсивность отказов, рассчитанная по Weibull и «плоской» модели, в сравнении с данными гарантийного обслуживания»
Название вертикальной оси (между цифрами точки заменить на запятые) — Суммарная интенсивность отказов за год эксплуатации пользователем
Название горизонтальной оси — Год эксплуатации пользователем
Weibull analysis = Анализ по Weibull
«Flatline» model = «Плоская» модель
Model based… = Модель оценки по данным гарантийного обслуживания
Как видно из приведенного выше графика, «плоская» модель дает более осторожную оценку, чем «чистый» анализ по Weibull, и очень близка к оценке по данным гарантийного обслуживания Seagate за первые три года. Для простоты анализа, а также для того, чтобы получить более осторожные оценки, мы решили применять в своих расчетах «плоскую» модель.
При использовании «плоской» модели суммарные результаты отношения между наработкой на отказ за все время эксплуатации к этому параметру за первый год могут выглядеть следующим образом:
Средние значения за первые три года: | |
---|---|
Отказов в год: | 0,768% |
Наработка на отказ: | 312 500 час |
Прирост по сравнению с некорректированным значением наработки на отказ (232 140 час): | 1,56 |
Средние значения за первые пять лет: | |
Отказов в год: | 0,682% |
Наработка на отказ: | 352 113 час |
Прирост по сравнению с некорректированным значением наработки на отказ (232 140 час): | 1,76 |
Средние значения за первые десять лет: | |
Отказов в год: | 0,617% |
Наработка на отказ: | 389 105 час |
Прирост по сравнению с некорректированным значением наработки на отказ (232 140 час): | 1,95 |
Проведенные расчеты показывают, что для оценки среднего времени наработки на отказ за три года эксплуатации дисковода нужно умножить исходный показатель за первый год (для той же продолжительности включения и окружающей температуры) на коэффициент 1,56. Аналогично можно рассчитать и среднее время наработки на отказ за пять и десять лет, умножив значение исходного параметра за первый год на 1,76 и 1,95 соответственно.
Окончательный расчет
На основе всех коэффициентов, рассчитанных выше, мы можем преобразовать наработку на отказ, указываемую фирмой Seagate (на первый год эксплуатации, при 2 400 рабочих часах в год и продолжительности включения 100%) в среднее время наработки на отказ для накопителя, установленного в устройстве конечного пользователя и работающего при конкретной окружающей температуре с определенной продолжительностью включения. После этого можно также оценить и среднее время наработки на отказ за все время службы накопителя.
Ниже приведен пример расчета среднего времени наработки на отказ в течение первого года и всего срока эксплуатации для накопителя, работающего в течение 2 400 часов в год при температуре 34°С, продолжительности включения 30% и рассчитанного на срок службы 5 лет.
Наработка на отказ за первый год: | 232 140 час | (на основе параметров бета и эта25 по Weibull) |
х 0,90 | (температурный коэффициент для 38°С и продолжительности включения 30%) | |
Наработка на отказ за первый год в устройстве пользователя: | 208 926 час | |
Наработка на отказ в устройстве пользователя: | 208 926 час | |
х 1,76 | (коэффициент усреднения за пятилетний период) | |
Наработка на отказ за весь срок эксплуатации в устройстве пользователя: | 367 710 час |
В качестве завершающего примера рассмотрим накопитель Seagate с одним жестким диском, для которого наработка на отказ в течение первого года составляет 444 000 час. Допустим, он установлен в бытовом электронном устройстве, используется 2 920 часов в год (8 часов в день, 7 дней в неделю) при окружающей температуре 42°С и продолжительности включения 5%.
Наработка на отказ за первый год: | 444 000 час | (на основе параметров бета и эта25 по Weibull) |
х 0,92 | (коррекция для 2 920 час/год) | |
х 0,59 | (температурный коэффициент для 42°С и продолжительности включения 5%) | |
х 1,95 | (коэффициент усреднения за 10-летний период) | |
Наработка на отказ в устройстве пользователя в течение первого года: | 469 956 час |
Заключение
Описанный выше метод позволяет использовать данные лабораторных испытаний Seagate для оценки надежности накопителей, установленных в настольных компьютерах и бытовых электронных приборах, которые работают в условиях «реального мира». Вкратце этот метод сводится к следующему:
- С помощью анализа Weibull или статистических данных испытаний RDT/FRDT оцените параметры Weibull для лабораторных условий.
- Используя методику WeiBayes, проанализируйте данные испытаний для конкретного типа накопителя; определите значения усредненной интенсивности отказов AFR за первый год и наработку на отказ при проведении испытаний RDT.
- Откорректируйте полученные результаты с учетом отличия лабораторных условий RDT от реальной температуры и продолжительности включения, при которых будет работать накопителей, установленный в аппаратуре конечного пользователя.
- Исходя из осторожного предположения, что после первого года эксплуатации интенсивность отказов останется постоянной, пролонгируйте оценку надежности за первый год на трех- и десятилетний срок службы накопителя.
В заключение отметим, что данный метод позволяет математически обоснованно применять результаты лабораторных испытаний Seagate для оценки надежности накопителей, установленных в бытовых электронных приборах.
Примечания:
1 SuperSmith, Fulton Findings, WinSMITH и WinSMITH Weibull являются зарегистрированными товарными знаками фирмы Fulton Findings (1251 W. Sepulveda Blvd., #800, Torrance, CA 90502, США).
2 Abernethy, Dr. Robert B., The New Weibull handbook, Second Edition, авторское издание, 1996, глава 5.
3 Abernethy, Dr. Robert B., The New Weibull handbook, Second Edition, авторское издание, 1996, приложение D.
4 Чтобы компенсировать неопределенность оценки параметров по Weibull из-за ограниченности времени работы дисководов, можно повысить доверительный уровень при проведении испытаний RDT.
5 Nelson, Wayne, Applied Life Data Analysis, John Wiley & Sons, 1982.
По материалам Seagate Technology
средняя наработка на отказ. Как спрогнозировать поломку жесткого диска
Восстановление данных » Восстановление файлов на жестком диске
Обновлено: 14. 09.2015, автор — Илья
Илья – главный редактор сайта softdroid.net. Является автором нескольких сотен руководств и статей по настройке Android. Около 15 лет занимается ремонтом техники и решением технических проблем iOS и Android. Имел дело практически со всеми более-менее популярными марками мобильных смартфонов и планшетов Samsung, HTC, Xiaomi и др. Для тестирования используется iPhone 12 и Samsung Galaxy S21 с последней версией прошивки.
Информация об авторе
Как можно узнать срок работы жесткого диска; где та грань износа, по достижению которой HDD необходимо срочно менять? На помощь приходит MTBF — показатель наработки на отказ
Мы все хорошо понимаем, что потеря данных может повлиять на каждого их нас весьма и весьма негативно. Для многих из нас, потеря значимой информации происходит в виде поломки жесткого диска (HDD). Это могут быть различные механические и электронные дефекты, которые делают информацию, хранящуюся на жестком диске, недоступной для чтения.
Есть десятки возможных причин для этого типа неисправности, начиная от логических ошибок программного обеспечения до очевидных или неявных физических повреждений HDD. Вместе с тем, мы не можем не упомянуть, что все устройства хранения данных имеют ограниченную продолжительность жизни.Большинство из нас может назвать некоторые признаки того, что жесткий диск на грани выхода из строя. Например, если ваш HDD диск издает звуки – от приятного уху жужжания, шума шлифовки, то это признак того, что жесткий диск собирается «склеить ласты». Кроме того, если доступ к данным на ПК замедляется или начинают проявляться странные действия или явления (поврежденные данные, bad-сектора и пропавшие без вести файлы) – это все надежные индикаторы некорректной работы жесткого диска.
К сожалению, нет так называемых научных показателей для выявления неисправности HDD и его будущих поломок или выхода из строя — хотя это помогло бы предупредить потерю информации и вовремя прибегнуть к срочному ремонту HDD.
Итак, как можно бизнес-пользователям, корпоративным и персональным пользователям предсказать, когда их жесткие диски достигнут грани работоспособности? Первый шаг – проверить смету изготовителей касательно продолжительности жизни устройства. Эти оценки, как правило, указаны как среднее время между отказами, или же наработка на отказ (MTBF). Это общий ориентир для жестких дисков. Что это означает в действительности и рассчитывается рейтинг наработки отказа, то есть MTBF?
Что такое среднее время наработки на отказ, т.е. примерный срок его службы
Рейтинг MTBF расшифровывается, как и звучит. Это средний период времени между одной присущей ошибкой и следующий в продолжительности жизни одного компонента. Другими словами, если была найдена неисправность и после этого отремонтирована, наработка на отказ – цифра, количество часов, когда можно ожидать функционирование жесткого диска в нормальном режиме, прежде чем он сломается снова или будет найдена малейшая неисправность.
В случае с потребительскими жесткими дисками, не редкость увидеть MTBF в промежутке около 300 000 часов. Это 12500 дней, или чуть более 34 лет. Между тем, жесткие диски более высокого класса рекламируются с MTB до 1,5 миллиона часов, что составляет около 175 лет. хотелось бы вы представить себе, как жесткий диск надежно работает в течение сотни лет? Это было бы сказкой для IT-менеджеров!
К сожалению, есть разница между средней наработки на отказ метрики и реальных продолжительности жизни. Метрика MTBF имеет долгую и выдающуюся родословную в военной и авиационно-космической техники. Цифры взяты из частоты ошибок в статистически значимого количества приводами, работающими в течение недель или месяцев, в то время.
Исследования показали, что, как правило, средняя наработка на отказ (MTBF) в реальности имеет более низкий показатель. В 2007 году исследователи из Университета Карнеги-Меллона исследовали образцы 100000 винчестеров с установленным MTB при условии диапазонов наработки на отказ от одного миллиона до 1,5 миллиона часов. Это приводит к ежегодному отказу (AFR) 0,88 процента. Однако данное исследование показало, что индекс, как правило, превышает один процент – от 3:58 процентов до 13 процентов в некоторых системах хранения информации.
Производители не закрывают глаза на несоответствие показателя MTBF к реальному сроку службы HDD накопителя. Недавно производители Seagate и Western Digital прекратили использовать метрики средней наработка на отказдля своих жестких дисков. Вместо этого пользователь вынужден использовать сторонний софт для диагностики (например, Victoria) либо исследовать диагностические показатели SMART (о чем читайте ниже).
Почему средняя наработка на отказ – неэффективный показатель износа HDD?
Вообще, показатель MTBF имеет смысл только тогда, когда устройство имеет постоянную интенсивность отказов, т.е. отказы распределены экспоненциально. Жесткие диски, в первую очередь, механические устройства, с механическими отказами. Т. е., механические отказов, как правило распределены.
Если мы предположим, что приложение использует большое количество жестких дисков, и ошибки распределены экспоненциально, число отказов в любых двух интервалах одинакового размера будет то же самое. Жесткий диск будет генерировать ошибки в 100-день, как и в 10000-день. Жесткие диски в реальных условиях эксплуатации имеют другой износ. После первоначальной фазы «младенческой смертности» (когда ошибки будут незначительны) произойдет какой-то момент времени, когда интенсивность отказов резко увеличится. Для типичных механических жестких дисков износ точка находится в возрасте от 3 до 5 лет непрерывной работы.
Как проверить жесткий диск на ошибки?
Вследствие, поскольку индекс средней наработки на отказ – относительно ненадежный индикатор здоровья жесткого диска, каким еще образом мы можем предсказать конец срока службы жесткого диска или другого устройства хранения данных? Далее мы будем обсуждать плюсы и минусы использования SMART – инструмента диагностики, который позволит определить время износа жесткого диска.
Информация по мотивам блога http://thedatarecoveryblog.com/
Пожалуйста, оцените статью:
Илья – главный редактор сайта softdroid.net. Является автором нескольких сотен руководств и статей по настройке Android. Около 15 лет занимается ремонтом техники и решением технических проблем iOS и Android. Имел дело практически со всеми более-менее популярными марками мобильных смартфонов и планшетов Samsung, HTC, Xiaomi и др. Для тестирования используется iPhone 12 и Samsung Galaxy S21 с последней версией прошивки.
Не нашли ответ на свой вопрос? Возможно, вы найдете решение проблемы на нашем канале в Youtube! Здесь мы собрали небольшие, но эффективные инструкции. Смотрите и подписывайтесь на наш youtube-канал!
Смотреть на Youtube
↑ Вернуться в начало ↑
Какой срок службы HDD и SSD дисков, USB накопителя?
Читайте о том, как долго будут работать те или иные устройства хранения данных? Как долго ваша информация будет защищена от сбоя или отказа накопителя?
Широко известно, что CD, DVD и Blu Ray диски крайне недолговечны, а как насчёт обычных жестких HDD дисков или твердотельных SSD накопителей? На такие вопросы, мы и попытаемся ответить в данной статье.
- HDD жесткие диски
- SSD Твердотельные накопители
- USB флэш накопители
- Подводим итоги
Что такое «ресурс» и «срок службы»
Термин «ресурс» обозначает износ устройства с начала использования и до предельного состояния, после чего эксплуатировать диск становится невозможно или с некоторыми ограничениями. Ключевые факторы, влияющие на износ – нагрузка и длительность работы. При определенных сценариях эксплуатации ресурс HDD выражается в цифрах: часах непрерывной или общей работы, объеме записанных или считанных данных, время запусков, число циклов включении/отключения шпинделя. Так же к ресурсу относится остаточное пространство на диске, что может использоваться для записи и чтения данных.
Под сроком службы следует понимать время работы жесткого диска до наступления замены или отказа, когда накопитель перестает функционировать. Факторы, влияющие на срок службы – износ и условия эксплуатации.
Оценка ресурса HDD
Жесткие диски оснащены технологией самоконтроля и анализа состояния — S. M.A.R.T. Технология наблюдает за основными характеристиками HDD/SSD накопителя, собирает данные о наработке и выставляет оценку для каждого параметра. При запросе данных информация отображается в понятном пользователю виде, что позволяет быстро оценить общее состояние накопителя и отдельных компонентов.
Обычно оценка состояния отображается цифрой в диапазоне 0-100, бывают и исключения для некоторых параметров, например 120 или 200. Чем выше цифра текущего значения, тем лучше состояние накопителя.
Дополнительно отображается наихудшее и пороговое значение. Наихудшее или худшее значение показывает минимальную оценку за определенный период времени. К примеру, температура диска всегда составляла 30 градусов, а при отсутствии обдува выросла до 40. Последнее наихудшее значение сохранится для статистики и останется таковым, пока не будет превышено.
Пороговое значение обозначает достижение выработки по определенному параметру, после чего диск следует заменить или отремонтировать, если остальные компоненты накопителя не достигли предельного значения. Если же заменить диск временно не представляется возможным, тогда стоит перенести все важные данные на другой накопитель, что бы предотвратить потерю данных в случае внезапной поломки.
Технология S.M.A.R.T предназначена только для анализа и сбора статистики. Уведомление пользователя о достижении предельных значений выработки ресурса не предусмотрено. Поэтому с целью предупреждения и выявления преждевременного износа следует просматривать значения S.M.A.R.T в приложениях для диагностирования: Aida64, CrystalDiskInfo, Victoria и т.д.
Наиболее подробную оценку ресурса отображает программа Victoria. Помимо значений израсходованного ресурса в окне утилиты отображается графа «остаток», что в визуальной форме позволяет оценить остаточное значение ресурса.
SMART в программе Victoria.
Признаки выработки ресурса: жесткий диск перестает функционировать, работает существенно медленнее при чтении/записи информации, запись или чтение имеющихся данных невозможна. Поэтому желательно периодически диагностировать
Оценка срока службы HDD
Обычно срок службы для замены, равен гарантийному сроку, что предоставляет производитель жесткого диска. По истечении гарантии выполняется замена накопителя аналогичным объемом. Причем замена производится даже при условии сохранения диском полной работоспособности. Такие требования установлены в большинстве компаний, что работают с данными или же у коммерческих организаций/предприятий. Поскольку дальнейшая эксплуатация «отработанных» накопителей может привести к внезапной поломке, что выльется к простою оборудования и/или затруднит доступ к данным.
Отработанные накопители подлежат уничтожению. При этом некоторые сотрудники компаний предпочитают оставить не полностью изношенные накопители себе или перепродать под видом восстановленных/ранее использованных. Часто предложения восстановленных дисков встречаются на зарубежных торговых площадках. Пользователи, что приобретали восстановленные накопители, утверждали, что диски не восстанавливались, а только эксплуатировались, вероятно, в дата-центрах.
Бытовые потребители продолжают эксплуатировать жесткие диски и после завершения гарантийного срока. Поэтому фактический срок службы HDD у некоторых пользователей достигает 10, а то и больше лет. Часто изношенные диски продолжают эксплуатировать в неответственных сценариях вплоть до полного прекращения работоспособности.
Что влияет на ресурс HDD
На ресурс диска влияет длительность работы накопителя и нагрузка. Под длительностью работы следует понимать общую наработку в часах, а так же время непрерывной работы. К слову значение непрерывной работы – без остановки, отдельно не отображается и входит в общее время наработки. Под нагрузкой следует понимать процессы записи и чтения информации с накопителя. Диск быстрее изнашивается в процессе активной нагрузки, в бездействии износ меньше.
Производители жестких дисков указывают в спецификации рекомендуемое годовое значение нагрузки и времени эксплуатации. Превышение указанных значений увеличивает нагрузку на диск. Так же в спецификации указывается общая надежность диска. Поэтому для надежной и длительной эксплуатации рекомендуется подбирать диск в соответствии с планируемыми сценариями использования.
К примеру, производитель HDD – Seagate указывает следующие параметры надежности/рекомендуемую рабочую нагрузку:
- Количество циклов запуска/остановки шпинделя за весь срок эксплуатации. Обычно указывается цифра в 300-600 тыс. запусков. При достижении указанной цифры имеется вероятность, что шпиндель придет в негодность. У некоторых экземпляров шпиндель продолжает работать и после 1.5 млн. запусков. А если учесть, что у некоторых накопителей 1 цикл равен одному запуску диска, достижение цифры в 300 тыс. циклов непосильная задача.
- Неустранимые ошибки чтения на бит. Подразумевается, что диск может не считать 1 бит данных при чтении 1000 Терабайт данных.
- Количество часов работы в режиме 24х7 в год. Время работы накопителя без выключения.
- Предельная рабочая нагрузка в год. Общий объем записанных и считанных данных.
- Средняя наработка на отказ за весь срок эксплуатации. Обычно указывается 1 млн. часов или 114 лет. Следует понимать, что указанная наработка относится к нескольким дискам. Например, у 10 дисков, что наработают 1 млн. часов вероятность отказа хотя бы одного – 99.9 %. Для 10 дисков с наработкой 100 тыс. часов вероятность отказа – 50%.
Надежность в спецификации HDD SkyHawk.
Для накопителей Seagate серии BarraCuda выставляются наименьшие параметры рабочей нагрузки, поскольку такие накопители ориентированы для бытовой эксплуатации.
- Количество циклов запуска/остановки шпинделя – 300-600 тыс.
- Неустранимые ошибки чтения – 1х1014.
- Количество часов работы в режиме 24х7 – 2400 в год или 100 дней.
- Предельная рабочая нагрузка в год – 55 ТБ.
У дисков серии Seagate SkyHawk/SkyHawk Ai выше параметры рабочей нагрузки, поскольку накопители предназначены для хранения видео с камер видеонаблюдения в круглосуточном режиме работы. Соответственно запас прочности изначально выше в сравнении с линейкой BarraCuda, так как учитываются повышенная эксплуатационная нагрузка.
- Количество циклов запуска/остановки шпинделя – 300 тыс.
- Неустранимые ошибки чтения – 1х1014/1х1015.
- Количество часов работы в режиме 24х7 – 8760 или 365 дней.
- Предельная рабочая нагрузка в год – 180/550 ТБ.
- Средняя наработка на отказ – 1/1.5 млн. часов.
Проверка жесткого диска средствами Windows
Инструмент проверки и исправления ошибок файловой системы, которые часто бывают причиной синих экранов и медленной работы компьютера, входит в стандартный набор приложений Windows. Это консольная (запускаемая через командную строку) утилита CHKDSK (check disk). Она умеет находить и восстанавливать сектора жесткого диска, поврежденные программными (soft bad sectors) и аппаратными (hard bad sectors) сбоями.
Чтобы начать проверку и восстановление HDD с помощью CHKDSK, сохраните открытые документы и вызовите командную строку. В Windows 10 это удобно делать через меню правой клавиши мыши на кнопке Пуск, в Windows 7 – из меню Пуск – Стандартные.
Впишите в консоль команду chkdsk /f /r и нажмите Ввод.
Параметр «/f» дает программе указание выполнить поиск и автоматическое исправление ошибок файловой системы, а параметр «/r» — найти и восстановить «битые» сектора, точнее, пометить их как испорченные, чтобы операционная система больше к ним не обращалась.
Утилита CHKDSK имеет и другие параметры запуска, подробно описанные на официальном сайте, которые также могут вам пригодиться.
В приведенном примере не указан том (буква) диска. Это значит, что текущий накопитель будет проверен полностью.
Для проверки системного тома CHKDSK требует завершения работы всех программ и операционной системы, поэтому вам придется перезагрузить компьютер. Тестирование продолжится от 15 минут до нескольких часов в зависимости от размера и состояния HDD. Ход проверки будет отображен в виде текста на черном экране.
После окончания сканирования CHKDSK проинформирует вас о результатах числовым кодом от 0 до 3, где:
- 0 означает, что ошибки не обнаружены. Жесткий диск в хорошем состоянии.
- 1 – ошибки найдены и успешно устранены.
- 2 – выполнена либо не выполнена очистка диска (если при запуске утилиты была выбрана эта операция).
- 3 – проверить накопитель или исправить ошибки не удалось. Этот код указывает на более серьезные неполадки винчестера, чем код 1.
Что влияет на срок службы HDD
Жесткий диск проработает дольше при бережном использовании. Для этого желательно эксплуатировать диск в соответствии с указанной рабочей нагрузкой, если такая информация имеется в спецификации. А ещё важно исключить негативные внешние факторы: вибрацию, пульсации БП, изменение температур, перепады тока и напряжения.
Вибрация
Негативный эффект создает не столько вибрация, как резонанс двух вибрирующих устройств, например ещё один HDD или корпусные вентиляторы. Вибрация вызывает ошибки позиционирования блоков магнитных дисков, что ухудшает общее состояние механических частей, а так же поверхность магнитного диска.
В качестве решения стоит использовать вентиляторы Noctua или аналоги, что не вызывают вибрацию. Если в корпусе имеется несколько корзин для установки HDD, то лучше разделить диски в нескольких корзинах. Так же как вариант установить самодельный крепеж из войлока для уменьшения передачи вибрации внутри корпуса.
Пульсации БП
Блоки питания внутри ПК создают пульсации, что негативно сказывается на электронных и механических деталях HDD и SSD дисков. Для линий питания 3.3В и 5В допустимые пульсации 50 мВ, для линий 12В – 120 мВ. Поскольку осциллограф для измерения найдется не в каждом доме, значения пульсаций у того или иного блока питаний лучше искать в обзорах, так как производитель может не предоставить данную информацию. Поэтому не стоит экономить на источнике питания.
Перепады тока и напряжения
Так же не качественный блок питания в процессе работы подает больше или меньше напряжения/тока. Подобные перепады не сложно замерять при помощи мультиметра. Кратковременные перепады накопитель переживет, а вот при постоянной эксплуатации высока вероятность выхода из строя. Так же поломку может вызвать изношенный блок питания, где за длительное время эксплуатации вышли из строя конденсаторы и другие силовые компоненты.
Внезапное отключение электричества
Резкое отключение электричества так же негативно сказывается на накопителях, в частности при записи данных. Поэтому желательно обзавестись ИБП – источником бесперебойного питания со встроенной батареей. Наличие автономного источника питания позволит корректно завершить работу накопителя и предотвратить потерю данных.
Так же желательно установить в жилье реле напряжение, что отключает подачу электричества при превышении или падении заданного напряжения. Такое устройство позволит защитить накопитель, компьютер и другие электроприборы.
Высокая или низкая температура
Рабочая температура жестких дисков обычно в пределах 25-45 градусов по Цельсию. Предельная температура 70 градусов и длительная эксплуатация при такой температуре приведет к поломке накопителя. Желательно удерживать температуру в пределах 25-35 градусов.
Информацию о нижней предельной температуре используемого накопителя подскажет программа Victoria. Обычно минимальная температура эксплуатации составляет 14 градусов. При этом лучше не доводить до снижения температуры ниже 20-25 градусов.
Перемещение во включенном состоянии
Не допускается двигать корпус или перемещать жесткий диск во включенном состоянии. Такие действия влияют на состояние механики и могут привести к повреждению считывающей головки и магнитного диска.
Защита от механических воздействий
Винчестер, как и иные компоненты компьютера, достаточно болезненно реагирует на все физические воздействия — постукивания, тряску, удары, вибрацию и проч. Дело в том, что во время работы в нем крутятся определенные детали, а такие механические влияния затрудняют их функционирование.
Простой совет от специалистов: старайтесь не перемещать системный блок ПК, ноутбук во время функционирования устройства. Естественно, такую технику стоит тщательно оберегать от ударов.
Вывод
Жесткие диски достаточно надежные и долговечные. Если не допускать перегрузок, обеспечить подвод качественного питания, оптимального охлаждения, исключить вибрацию и внезапные обрывы электропитания, жесткий диск запросто прослужит 5-10 или больше лет. При этом никто не застрахован от внезапной поломки, что приведет к отказу работы накопителя с приличным «запасом прочности». Так же встречается брак и скрытые дефекты, что обычно проявляются впервые месяцы или год эксплуатации. Поэтому желательно хранить ценную информацию на нескольких накопителях или Raid-массивах. Так же стоит периодически просматривать S.M.A.R.T дисков, что бы заранее предупредить выход из строя отработанного накопителя.
А как долго прослужил ваш жесткий диск? Делитесь наработкой вашего накопителя, а так же задавайте вопросы в комментариях под статьей.
Проведение дефрагментирования винчестера
Работая на компьютере, нам периодически приходится удалять, перемещать, перезаписывать различные элементы. Вследствие этого на винчестере остаются фрагментированные файлы. Дело в том, что жесткий диск не переписывает информацию самостоятельно, а использует свободное место для части документа, записывает дальше остаток.
Все ведет к тому, что магнитной головке устройства в дальнейшем приходится работать в пару раз интенсивнее, чтобы считать необходимую информацию. А это приводит к скорому выходу винчестера из строя. Как избежать? Путем своевременной дефрагментации дискового пространства.
«Мудрить» для этого не нужно — соответствующую утилиту уже содержит популярная ОС «Виндовс». Использовать программу несложно:
- Зайдите в «Мой компьютер», найдите необходимый локальный (жесткий внутренний) диск.
- Нажмите на его название правой кнопкой мыши.
- Зайдите в раздел «Свойства».
- Кликните на вкладку «Сервис».
- Теперь достаточно нажать мышкой на «Выполнить дефрагментацию». Вот и все. Постарайтесь повторять эту процедуру периодически.
Если вам по каким-то причинам не подходит стандартная программа, то можете обратить внимание на аналогичные продукты сторонних разработчиков: Defraggler, Smart Defrag, O&O Defrag, Auslogics Disk Defrag и проч.
Как долго служат жесткие диски?
Примечание редактора: Этот пост был обновлен с момента его первоначальной публикации в 2013 году, чтобы предоставить самую свежую информацию и статистику.
Каков срок службы жестких дисков? Мы задали этот вопрос несколько лет назад, и в то время ответ был таков: мы еще не знали. Тем не менее, мы представили данные, которые у нас были на тот момент, и сделали несколько прогнозов. С тех пор мы прошли школу по частоте отказов жестких дисков (HDD) и твердотельных накопителей (SSD). Давайте посмотрим, чему мы научились.
Первоначальное исследование срока службы дисков было проведено с использованием 25 000 дисков и данных примерно за четыре года. Сегодняшнее исследование включает данные с более чем 200 000 жестких дисков, многие из которых прослужили шесть лет и дольше. Это дает нам больше данных для анализа и позволяет расширить наши прогнозы. Например, в нашем первоначальном отчете мы сообщали, что 78% приобретенных нами дисков прожили более четырех лет. Сегодня около 90 % имеющихся у нас накопителей служат четыре года, а 65 % живут дольше шести лет. Итак, как долго живут диски? Продолжай читать.
Как диски используются в BackblazeВ настоящее время Backblaze использует более 200 000 жестких дисков для хранения данных наших клиентов. Размер накопителей варьируется от 4 ТБ до 18 ТБ. Если сложить все вместе, под управлением окажется более двух эксабайт пространства на жестком диске. Большинство этих дисков установлены на сервере хранения, который вмещает 60 дисков, а также загрузочный диск. Есть также несколько серверов хранения, которые используют только 45 жестких дисков. Серверы хранения состоят из модулей хранения (наших собственных серверов хранения) и серверов хранения от сторонних производителей. Двадцать серверов хранения сгруппированы в Backblaze Vault, в котором используется наш собственный алгоритм кодирования стирания Рида-Соломона для репликации и хранения данных клиентов на 20 серверах в Backblaze Vault.
Типы анализируемых жестких дисковЖесткие диски, которые мы используем для хранения данных клиентов, представляют собой стандартные 3,5-дюймовые диски, которые можно купить в Интернете или в магазинах. Избыточность, обеспечиваемая программным обеспечением Backblave Vault, обеспечивает безопасность данных, позволяя нам использовать готовые диски трех основных производителей: Seagate, Western Digital и Toshiba. На следующей диаграмме наше текущее количество дисков разбито по производителям. Обратите внимание, что HGST теперь является частью Western Digital, но сами диски указываются как диски HGST, поэтому они указаны в таблице отдельно.
Каждый из серверов хранения также использует загрузочный диск. Помимо очевидной функции загрузки сервера, мы также используем эти диски для хранения файлов журналов, регистрирующих доступ к системе и действия, которые используются в целях аналитики и соответствия требованиям. Загрузочным диском может быть как HDD, так и SSD. Если вам интересно, мы сравнили надежность жестких дисков и твердотельных накопителей в отношении этих загрузочных дисков.
Количество жестких дисковКак уже говорилось ранее, в настоящее время мы управляем более чем 200 000 жестких дисков, которые мы используем для хранения данных клиентов. Мы используем несколько разных размеров дисков, как показано в таблице ниже, причем более 60% этих дисков имеют размер 12 ТБ или 14 ТБ.
Частота отказов накопителейПрежде чем углубляться в данные о частоте отказов, стоит потратить немного времени на выяснение того, что именно означает частота отказов. Сам по себе термин «частота отказов» не очень полезен, поскольку в нем отсутствует понятие времени. Например, если вы купили жесткий диск, какова частота отказов жесткого диска, который вышел из строя через неделю после покупки? А через год после покупки? Пять лет? Они не могут иметь одинаковую частоту отказов. Чего не хватает, так это времени. Когда мы выпускаем ежеквартальные и годовые отчеты Drive Stats, мы рассчитываем и публикуем годовую частоту отказов (AFR). При использовании AFR все частоты отказов переводятся в годовые значения, поэтому независимо от временных рамок (например, один месяц, один год, три года) мы можем сравнивать разные когорты дисков. Наряду с отчетами мы включаем ссылки на данные дисков, которые мы используем для расчета заявленной частоты отказов.
Кривая ванныИнженеры по надежности используют так называемую кривую ванны для описания ожидаемой частоты отказов. Идея состоит в том, что дефекты возникают по трем причинам: (1) заводские дефекты, приводящие к «детской смертности», (2) случайные отказы и (3) изнашивающиеся детали, приводящие к отказам после длительного использования. На приведенной ниже диаграмме (из Wikimedia Commons) показано, как можно ожидать, что эти три фактора создадут кривую частоты отказов в форме ванны.
Когда наше первоначальное исследование срока службы привода было завершено, опыт Backblaze совпал с теорией кривой ванны. Когда мы недавно пересмотрели кривую ванны, мы обнаружили, что ванна протекает, поскольку левая часть кривой ванны Backblaze (уменьшение частоты отказов) была намного ниже и больше соответствовала постоянной частоте отказов. Это можно увидеть на приведенной ниже диаграмме, которая охватывает данные о сбоях жестких дисков за последние шесть лет.
Частота отказов (красная линия) составляет менее 2% в течение первых трех с половиной лет, а затем быстро увеличивается в течение шестого года. Когда мы строим линию тренда данных (синяя пунктирная линия, полином второго порядка), появляется параболическая кривая, но она значительно ниже с левой стороны и выглядит не столько как ванна, сколько как неглубокий ковш или, возможно, хоккейный мяч. палка.
Расчет ожидаемого срока службыКаков ожидаемый срок службы жесткого диска? Чтобы ответить на этот вопрос, нам сначала нужно решить, что мы подразумеваем под «ожидаемой продолжительностью жизни».
При измерении ожидаемой продолжительности жизни людей обычным показателем является среднее количество лет, оставшихся в данном возрасте. Например, по оценкам Всемирной организации здравоохранения, ожидаемая продолжительность жизни всех новорожденных в мире в настоящее время составляет 73 года. Это означает, что если мы подождем, пока все эти новые люди проживут свою жизнь за 120 или 130 лет, средняя продолжительность их жизни составит 73,0 года.
Для жестких дисков может случиться так, что все они изнашиваются до того, как им исполнится 10 лет. Или может быть, что некоторые из них длятся 20 или 30 лет. Если некоторые из них живут очень-очень долго, вычислить среднее значение затруднительно. Кроме того, несколько выбросов могут отклонить среднее значение и сделать его менее полезным.
Число, которое должно быть рассчитано, — это средний срок службы нового диска. Это возраст, в котором половина дисков выходит из строя. Давайте посмотрим, насколько близко мы можем приблизиться к прогнозированию среднего срока службы нового диска, учитывая все данные, которые мы собирали за многие годы.
Показатели выживаемости жестких дисковПо сей день на удивление трудно получить ответ на вопрос «Как долго прослужит жесткий диск?» Как уже отмечалось, мы регулярно публикуем отчеты о статистике накопителей, в которых перечислены значения AFR для используемых нами моделей накопителей. Хотя эти отчеты отвечают на вопрос, с какой скоростью дисководы выходят из строя, они не говорят нам, как долго они прослужат. Интересно, что те же данные, которые мы собираем и используем для прогнозирования выхода из строя дисков, можно использовать для определения ожидаемого срока службы моделей жестких дисков, которые мы используем. Все дело в том, как вы смотрите на данные.
Когда мы применяем методы прогнозирования ожидаемой продолжительности жизни к собранным нами данным о дисках, мы получаем следующую диаграмму: затем снижение начинает ускоряться. Оглядываясь назад на приведенную выше диаграмму AFR по кварталам, мы видим, что это имеет смысл, поскольку частота отказов увеличивается, начиная с четвертого года. Через шесть лет ожидаемая продолжительность жизни составляет 65%. Другими словами, если мы купили жесткий диск шесть лет назад, то с вероятностью 65% он все еще жив.
Как долго прослужат жесткие диски?Что происходит с дисками, когда им больше шести лет? У нас есть диски старше шести лет, так почему мы остановились на этом? У нас не было достаточно данных, чтобы быть уверенными после шести лет, так как количество дисков в этот момент падает и почти полностью состоит из одной или двух моделей дисков по сравнению с разнообразным выбором. Вместо этого мы использовали данные, которые у нас были за шесть лет, и экстраполировали линию ожидаемого срока службы, чтобы оценить точку, в которой половина дисков выйдет из строя.
Как долго служат диски? Казалось бы, разумная оценка средней продолжительности жизни составляет шесть лет и девять месяцев. Это соответствует минимальному объему данных, которые мы собрали на сегодняшний день, но, как уже отмечалось, у нас недостаточно данных, чтобы быть уверенными. Тем не менее, мы знаем, что для всех моделей приводов, которые мы используем, этот срок превышает шесть лет. Мы продолжим собирать данные в ближайшие месяцы и годы и посмотрим, изменится ли что-нибудь.
Между тем, как долго, по вашему мнению, прослужит жесткий диск, который вы собираетесь купить? Правильный ответ — всегда иметь хотя бы одну резервную копию, а лучше две, хранить их отдельно и часто проверять — стратегия резервного копирования 3-2-1. Каждый купленный вами жесткий диск в какой-то момент выйдет из строя — это может произойти через день или через 10 лет — будьте готовы.
Как долго служат жесткие диски? Срок службы и признаки отказа
Как долго служат жесткие диски? Этот важный вопрос должен задать каждый бизнес и каждый человек, обладающий ценными данными. Немногие люди осознают, что их жесткий диск выйдет из строя через достаточное количество времени. Цитата из книги Чака Паланика « Бойцовский клуб »: «На достаточно длительной временной шкале коэффициент выживания для всего падает до нуля». То есть по прошествии достаточного времени каждый жесткий диск в конечном итоге выйдет из строя.
Срок службы жесткого диска зависит от многих переменных, таких как марка, размер, тип и среда. Более авторитетные бренды, производящие надежное оборудование, будут иметь диски, которые прослужат дольше. Если вы читаете/записываете больше данных на свой диск, ваш жесткий диск стареет быстрее. Кроме того, жесткие диски реагируют на чистоту окружающей среды, поэтому будьте внимательны к проблемам с электричеством и пыли. И, наконец, как мы всегда говорим здесь, в Prosoft Engineering, убедитесь, что у вас есть актуальная резервная копия вашего жесткого диска.
Срок службы жесткого диска
Вообще говоря, вы можете рассчитывать на свой жесткий диск в среднем от трех до пяти лет. Убедительное исследование, подтвердившее эту статистику, было проведено компанией Backblaze, занимающейся онлайн-резервным копированием, которая проанализировала частоту отказов 25 000 работающих жестких дисков. Они обнаружили, что 90% жестких дисков служат три года, а 80% — четыре года. Но это число варьировалось в зависимости от бренда. Согласно исследованию Backblaze, жесткие диски Western Digital и Hitachi прослужили гораздо дольше, чем диски Seagate.
Вот инфографическая скорость, основанная на данных исследования Backblaze:
Данные показывают, что жесткие диски имеют три сегмента частоты отказов. Первый сегмент связан с первыми полутора годами, когда ежегодно выходит из строя 5% жестких дисков. Высокая начальная частота отказов может быть объяснена производственным браком. В каждой партии жестких дисков будет несколько лимонов.
После этого частота отказов выравнивается до 1% в год. Объясняется это случайными отказами дисков. Затем через три года жесткие диски начинают изнашиваться. Суть в том, что компоненты жесткого диска могут перемещаться только до того, как они начнут выходить из строя.
Следует отметить, что компания Backblaze использовала жесткие диски потребительского класса, на которые обычно распространяется гарантия от двенадцати до тридцати шести месяцев. Таким образом, сроки гарантии кажутся правильными, в то время как на жесткие диски корпоративного уровня обычно предоставляется пятилетняя гарантия или дольше.
Жесткие диски (HDD) и твердотельные накопители (SSD)
Два наиболее популярных типа жестких дисков имеют разный срок службы. Мой коллега недавно написал в блоге информативную запись, в которой подробно описывается разница между жесткими дисками и твердотельными накопителями, которая может предоставить вам обширную информацию. Но здесь я коснусь того, как долго прослужит каждый тип.
Жесткие диски физически записывают код на пластину жесткого диска в приводе. Поскольку жесткие диски имеют крошечные движущиеся части внутри, они более уязвимы для физических сбоев, чем твердотельные накопители. Вы найдете жесткие диски в большинстве настольных компьютеров и ноутбуков.
Твердотельные накопители используют флэш-технологию для сохранения данных. Твердотельные накопители дороже, но и надежнее жестких дисков. В SSD нет движущейся пластины, поэтому они не подвержены более традиционным отказам жестких дисков. Однако SSD по-прежнему использует конденсатор и блоки питания, которые могут выйти из строя.
Способы предотвратить сбой жесткого диска
Вы можете защитить себя от сбоя жесткого диска, приняв некоторые меры предосторожности. Первый шаг — иметь резервную копию. Имея завершенную текущую резервную копию, вы защищаете себя от возможной потери данных. Чтобы получить советы о том, как правильно поддерживать резервное копирование, ознакомьтесь с полным руководством по резервному копированию данных для домашних и профессиональных пользователей.
Следующий шаг — защитить среду вокруг жесткого диска от угроз. Многие вещи могут нарушить работу жесткого диска. К ним относятся пыль, жара, погода, кража, скачки напряжения и опасности во время движения.
Наконец, замените жесткий диск через 3-5 лет. Как вы только что прочитали, жесткие диски со временем выходят из строя. Перемещая данные на новый жесткий диск, вы создаете избыточность данных и даете себе больше времени для безопасного хранения данных.
Признаки отказа жесткого диска
Существует множество тонких признаков того, что ваш жесткий диск может выйти из строя. Будьте осторожны, если ваш компьютер замедляется, часто зависает или отображает предупреждение о поврежденных данных или поврежденных секторах. Вредоносные вирусы и неправильное завершение работы также могут повлиять на ваш жесткий диск.
Для диагностики попробуйте запустить компьютер в безопасном режиме. Если вы хотите получить комплексное программное обеспечение для защиты жесткого диска Mac, попробуйте Drive Genius 6 — предпочтительный инструмент Apple Genius Bar. Программное обеспечение автоматизирует безопасность вашего жесткого диска, сканируя логические и физические проблемы. Он может исправить проблемы с каталогами и ошибки согласованности. Новейшей функцией является защита от вредоносных программ, которая просматривает ваши новые загрузки и старые файлы на наличие известных вредоносных программ.
Но если вы заметили странные щелчки или скрежет, исходящие от вашего жесткого диска, возможно, у вас физический сбой. Обязательно выключите жесткий диск, чтобы избежать дальнейшего повреждения. Для получения дополнительной информации о физическом сбое жесткого диска прочитайте нашу недавнюю страницу восстановления жесткого диска.
Как восстановить данные с помощью macOS Catalina
Обновление до macOS Catalina иногда может вызвать проблемы с восстановлением данных. Если это случилось с вами или вы просто не можете найти определенный файл на своем Mac, есть несколько способов устранить эту проблему. Во-первых, вы должны убедиться, что файл случайно не попал в корзину. Для этого нажмите на свою корзину, и появится окно, которое позволит вам выполнить поиск вашего файла. Просто введите имя файла в окно поиска и найдите его.
Если ваш файл не появляется в окне поиска, возможно, вам придется поискать его еще немного. К счастью, все Mac поставляются со встроенной системой резервного копирования данных под названием Time Machine. Чтобы использовать Time Machine, откройте программу, которая использовалась для создания файла. Например, если это был документ, откройте «Документы». Затем используйте Launchpad, чтобы открыть приложение Time Machine. Оказавшись в приложении, вы сможете найти свой файл, а затем нажать «Восстановить», чтобы вернуть файл на свой компьютер.
Если ни один из этих вариантов не работает, обратитесь к профессиональному специалисту по восстановлению данных, чтобы выяснить, как восстановить файлы macOS Catalina без стресса и ненужных затрат.
Если ваш жесткий диск вышел из строя
Существует две основные причины отказа дисков: логическая и физическая. В случае логических сбоев вы можете использовать программное обеспечение для восстановления данных, такое как Data Rescue, чтобы снова найти свои данные. Программное обеспечение для восстановления данных работает с дисками, которые были повреждены, стерты или повреждены.
В случае физического сбоя жесткого диска вы можете обратиться в Центр спасения данных в Силиконовой долине, Калифорния. Data Rescue Center предлагает бесплатную доставку, бесплатную оценку и бесплатную политику отсутствия данных. Центр спасения данных является самым профессиональным и технологически продвинутым учреждением в Соединенных Штатах. Наш персонал службы поддержки в США поможет вам преодолеть все трудности, чтобы обеспечить успешное выздоровление.
Рекомендации по замене дисков
(Партнерские ссылки)Существует множество вариантов замены дисков. Любой работающий диск позволит системе восстановиться и работать. Тем не менее, мы выбрали несколько сменных накопителей, которые, по нашему мнению, являются надежными и популярными в данной области.
ifixit.com предлагает сотни руководств по извлечению диска из большинства ноутбуков и настольных компьютеров. Эти руководства также содержат информацию о типе накопителя в системе, чтобы приобрести правильную замену. Мы рекомендуем SSD (твердотельный накопитель), поскольку он обеспечивает наилучшую производительность и подходит для большинства устройств. Пожалуйста, посетите ifixit.com/Guide для получения информации о вашей конкретной системе.
SSD (твердотельный накопитель)
SAMSUNG 870 EVO SATA III SSD 1 ТБ 2,5-дюймовый внутренний твердотельный жесткий диск
Samsung Electronics 870 EVO 500 ГБ 2,5-дюймовый SATA III внутренний твердотельный накопитель
M.2
7 ТБ Plus 1 ТБ SAMSUNG 9 1 ТБ , Интерфейс M.2 NVMe Внутренний твердотельный жесткий дискSAMSUNG 970 EVO Plus SSD 500 ГБ — Интерфейс M.2 NVMe Внутренний твердотельный накопитель
Жесткий диск (жесткий диск)
Внутренний жесткий диск Seagate BarraCuda 4 ТБ Жесткий диск — 3,5 дюйма Sata 6 Гбит/с, 5400 об/мин, 256 МБ кэш-памяти
Жесткий диск Western Digital 4 ТБ WD Blue для ПК — 5400 об/мин, SATA 6 Гбит/с, 256 МБ кэш-памяти, 3,5 дюйма — WD40EZAZ
Как долго реально работает внешний жесткий диск? технологии инструментов для работы с жесткими дисками, клиенты часто обращаются ко мне с вопросом: «Как долго прослужит мой внешний жесткий диск?»
А затем продолжение «Когда произойдет сбой жесткого диска?» или «Когда можно ожидать сбоя жесткого диска?»Ответы не совсем однозначны, но существует консенсус в отношении того, как долго вы можете ожидать работы обычного жесткого диска, независимо от того, является ли он внешним или внутренним. 0003
Итак, давайте перейдем к делу: каков срок годности вашего жесткого диска?Во-первых, давайте начнем с жестких дисков (HDD). Самый простой ответ заключается в том, что они могут бесперебойно работать от трех до пяти лет. Это означает любой жесткий диск, будь то внешний или внутри системы. Вопрос о долговечности внешнего корпуса — металлического или пластикового корпуса, предназначенного для покрытия и защиты дисковода от повреждений — это совсем другой вопрос. Правда бывает разным.
Даже в случае отказа корпуса диск можно восстановить. Вы можете просто получить новый сменный корпус, так что это не большая проблема. Важно то, как вы предотвратите потерю данных, хранящихся на самом диске. Производители жестких дисков обычно указывают «среднее время наработки на отказ» (MTBF) и/или «годовую частоту отказов» (AFR) для своих дисков. Среднее время безотказной работы и AFR связаны, но представляют несколько разные типы данных. Среднее время безотказной работы описывает расчетное количество часов работы до механического отказа диска. В стандарте AFR описывается процент вероятности отказа диска после полного года использования.
Однако следует отметить, что механическая конструкция жестких дисков дает им некоторую вероятность случайного отказа. Это затрудняет предсказание ровно того, как долго прослужит жесткий диск. Отказы возникают по разным причинам, начиная от температуры и условий магнитного поля и заканчивая производственным браком.
Что насчет твердотельных накопителей?
Из-за отсутствия движущихся частей твердотельные накопители (SSD) имеют гораздо более предсказуемую частоту отказов, чем механическая природа жестких дисков.
Сбой SSD зависит от объема данных, записанных в терабайтах (TBW), а не от определенного времени безотказной работы. С помощью некоторых тщательных расчетов вы сможете получить приблизительную оценку того, сколько времени пройдет, пока SSD не выйдет из строя. Твердотельные накопители не совсем соответствуют емкости жестких дисков, поэтому более вероятно, что вы будете использовать жесткий диск в качестве внешнего жесткого диска для хранения данных.
Простые и эффективные привычки для улучшения состояния жесткого дискаХотя в среднем срок службы может составлять от трех до пяти лет, теоретически жесткие диски могут служить намного дольше (или меньше, если уж на то пошло). Как и в большинстве случаев, если вы позаботитесь о своем жестком диске, он лучше прослужит своему потенциалу.
Вот некоторые из самых простых мер предосторожности, которые вы можете предпринять, чтобы защитить жесткий диск от преждевременного выхода из строя:
- Бережно обращайтесь с диском. Жесткие диски сконструированы таким образом, что любое физическое повреждение может действительно все испортить… и ваши данные могут быть потеряны в одно мгновение. Обращаясь с жестким диском, обращайтесь с ним осторожно, как с ребенком или яйцом (например, с тем, которое вы должны сохранить живым для школьного урока естествознания, а не с тем, которое вы разбиваете на завтрак).
- Контроль внешней температуры. Жесткие диски нагреваются, когда они включены и активны. Это данность. Важно держите жесткие диски вдали от теплых или горячих условий , которые могут привести к большему нагреву диска, что приведет к дополнительной ненужной нагрузке на него (если только он не предназначен для работы при высоких температурах). Повредить диск при более низких температурах гораздо сложнее, чем при более высоких температурах. Это должно быть на самом деле холодно.
- Включайте накопитель только тогда, когда он вам нужен. Неважно, внутренний это или внешний жесткий диск. Это относится к обоим. Правда в том, что чем больше ваш жесткий диск активен, тем больше он работает — даже если он простаивает — и чем больше он работает, тем больше он изнашивается.
- Извлеките внешний диск из хост-системы. Сделайте это до физического отключения или отключения корпуса. Это поможет защититься от возможного повреждения данных, которое в долгосрочной перспективе может привести к более разрушительному сбою жесткого диска.