Не менее важно понимать, что среднестатистическое время между сбоями определяется для всех накопителей одной модели, а не для отдельного накопителя. Если указано, что это время равно 500 тыс. ч, значит, ошибка может появиться при общем времени работы 500 тыс. ч всех накопителей данной модели. Если выпущен миллион накопителей данной модели и все они одновременно работают, то можно ожидать появления ошибки каждые полчаса. Параметр "среднестатистическое время между сбоями" неприменим для отдельного накопителя или небольшой выборки накопителей одной модели.
Кроме того, необходимо правильно понимать значение слова "ошибка". В определении описанного выше параметра под ошибкой подразумевается полный выход из строя накопителя (т.е. его следует вернуть производителю), а не появляющиеся ошибки чтения или записи файлов.
В заключение отметим, что не следует уделять слишком много внимания такому параметру, как среднестатистическое время безотказной работы (MTBF). Для отдельного накопителя эта величина является не более чем неточно прогнозируемым показателем надежности. Однако если вам, как администратору информационных систем, приходится каждый год приобретать несколько тысяч компьютеров и накопителей или заниматься формированием и поддержкой множества различных систем, то стоит не только изучить эти показатели, но и познакомиться с методами их определения. Если удастся понять метод вычислений, используемый поставщиком, и определить фактическую надежность многих моделей накопителей, это позволит приобрести более надежные устройства и сохранить время и деньги, необходимые для их обслуживания и поддержки.
S.M.A.R.T.
Технология самотестирования, анализа и отчетности (Self-Monitoring, Analysis and Reporting Technology — S.M.A.R.T.) — это новый промышленный стандарт, описывающий методы предсказания появления ошибок жесткого диска. При активизации системы S.M.A.R.T. жесткий диск начинает отслеживать определенные параметры, чувствительные к неисправностям накопителя или указывающие на них. На основе отслеживаемых параметров можно предсказать сбои в работе накопителя. Если на основе отслеживаемых параметров вероятность появления ошибки возрастает, S.M.A.R.T. генерирует для BIOS или драйвера операционной системы отчет о возникшей неполадке, который указывает пользователю на необходимость немедленного резервного копирования данных до того момента, когда произойдет сбой в накопителе.
На основе отслеживаемых параметров S.M.A.R.T. пытается определить тип ошибки. По данным компании Seagate, 60% ошибок механические. Именно этот тип ошибок и предсказывается S.M.A.R.T. Разумеется, не все ошибки можно предсказать, например появление статического электричества, внезапную встряску или удар, термические перегрузки и т.д.
Технология S.M.A.R.T. была разработана IBM в 1992 году. В том же году IBM выпустила жесткий диск формата 3,5 дюйма с модулем Predictive Failure Analysis (PFA), который изме рял некоторые параметры накопителя и в случае их критического изменения генерировал предупреждающее сообщение. IBM передала на рассмотрение организации ANSI спецификацию технологии предсказания ошибок накопителя, и в результате появился ANSI-стандарт — протокол S.M.A.R.T. для SCSI-устройств (документ X3T10/94-190).