Система тестирования сотрудников, для предприятий

Содержание:

Программы для просмотра S.M.A.R.T.
Как использовать SMART для прогнозирования сбоя жесткого диска или SSD (необходимо проверить значения)
Встроенные функции самоконтроля (self-test)
Что делать с ошибками S.M.A.R.T.
History and predecessors
Теперь разберем по порядку, что означают эти атрибуты S.M.A.R.T
А теперь немного о параметрах, выводимых программой.
- Критичные атрибуты:
- Некритичные атрибуты:

Программы для просмотра S.M.A.R.T.

Ряд производителей HDD выпускают также утилиты собственной разработки, предназначенные для получения информации от S.M.A.R.T. Они максимально адаптированы для работы с носителями определенных моделей. Но такой софт разработан не для всех винчестеров, да и его возможностей иногда оказывается недостаточно для всесторонней оценки состояния накопителя.

В качестве альтернативы можно использовать один из многочисленных программных продуктов, созданных сторонними разработчиками. Далее мы рассмотрим несколько хорошо зарекомендовавших себя приложений, предоставляющих доступ к S.M.A.R.T.

CrystalDiskInfo

CrystalDiskInfo – бесплатное приложение для просмотра параметров S.M.A.R.T. и оценки тенденции их изменений. Интерфейс утилиты полностью русифицирован (язык можно переключить с помощью меню). Температура винчестера или твердотельного накопителя показывается в системном трее (внизу экрана справа). Программа позволяет построить график, на котором будут наглядно отображены изменения, произошедшие за последний месяц с носителем информации. В случае необходимости приложение может быть запущено с задержкой. С помощью CrystalDiskInfo пользователю удобно изменить режим работы жесткого диска: установить максимально возможную скорость либо включить режим экономии электроэнергии (при этом также уменьшится издаваемый HDD шум). Помимо этого, разработчиками реализована поддержка внешних HDD и карманов, а также RAID-массивов Intel.

AIDA64

С помощью данного приложения можно получить информацию обо всех аппаратных компонентах системы и их технических характеристиках, а также выполнить их тестирование. Для просмотра информации о жестком диске следует перейти к разделу «Меню» в левой части окна и щелчком по треугольнику слева открыть подменю «Хранение данных». В его нижней части присутствует пункт «SMART», именно его и нужно выбрать. В правой секции окна вверху появится список всех установленных в системе жестких дисков. Остается выбрать только нужный накопитель и щелкнуть мышью по соответствующей строке. Сведения о выбранном диске будут отображены в секции ниже.

AIDA64 – условно-бесплатное приложение, период безвозмездного пользования которым ограничен 30 днями. Чтобы иметь возможность работать с ним и дальше, необходимо купить лицензию.

Victoria

Victoria – одна из лучших утилит для диагностики и восстановления неисправностей жестких дисков. Существует 2 версии программы: для запуска с загрузочного носителя и для работы непосредственно в среде Windows. В последнем случае для корректной работы приложения его следует запускать от имени администратора (соответствующую команду можно выбрать из его контекстного меню посредством щелчка по значку правой кнопкой мыши). Для загрузки с внешнего носителя потребуется предварительно создать загрузочный USB-диск или CD (DVD) и записать на него образ приложения.

После того, как Victoria запустится, на вкладке «Standard» в правой половине окна вверху выбираем тестируемый HDD и жмем на кнопку «Passport» для обновления сведений о нем. В самом низу окна отобразится информация о модели винчестера, его вместимости в дорожках и серийном номере. Затем можно переходить на вкладку “SMART”. Для считывания данных нажимаем на кнопку «Get SMART» в правой секции окна вверху.

При всех своих прочих достоинствах программа бесплатна. Также следует отметить, что ее новейшие версии поддерживают работу со S.M.A.R.T.-данными SSD-накопителей.

HDDScan

Отличительной особенностью утилиты является предельная простота в использовании. Достаточно выбрать из списка «Select Drive» жесткий диск и нажать на кнопку «S.M.A.R.T.», как на экране появится новое окно с подобной информацией о жестком диске. Разработчиками предусмотрена возможность менять некоторые из этих параметров (AAM, APM и др.). И за все это платить ничего не надо.

Speccy

С помощью бесплатного приложения Speccy с поддержкой русского языка можно получить сведения об установленных в компьютере комплектующих и их технических характеристиках. Предусмотрена возможность сохранения этой информации в виде подробного отчета.

Из меню в левой части экрана выбираем «Хранение данных», и в правой части окна приложения появятся сведения сразу обо всех установленных на машине пользователя жестких дисках. Если информация сразу не будет выведена на экран, надо подождать несколько секунд до завершения ее считывания.

Как использовать SMART для прогнозирования сбоя жесткого диска или SSD (необходимо проверить значения)

Не все атрибуты SMART имеют решающее значение для прогнозирования сбоев. Два вышеупомянутых исследования частоты отказов жестких дисков и других источников согласны с тем, что важная помощь в выявлении неисправных дисков:

Reallocated sector counts. Перераспределение происходит, когда логика привода перераспределяет поврежденный сектор в результате повторяющихся программных или жестких ошибок в новый физический сектор из его резервных. Этот атрибут отражает количество случаев повторного отображения. Если его значение увеличивается, это указывает на износ жесткого диска или SSD.
Current Pending Sector Count. Это подсчитывает «нестабильные» сектора, то есть поврежденные с ошибками чтения, которые ждут переотображения, своего рода «испытательная» система. Алгоритмы SMART имеют смешанные представления об этом конкретном атрибуте, поскольку иногда это неубедительно. Тем не менее, он может обеспечить более раннее предупреждение о возможных проблемах.
Reported Uncorrectable Errors. Это количество ошибок, которые невозможно исправить, и это полезно, потому что кажется, что оно имеет одинаковое значение для всех производителей.
Erase Fail Count. Этот является отличным показателем преждевременной смерти твердотельного накопителя. Он подсчитывает количество неудачных попыток удаления данных, а значение, которое увеличивается, говорит о том, что флеш-память внутри твердотельного накопителя близка к завершению.
Wear Leveling Count. Это также особенно полезно для твердотельных накопителей. Производители устанавливают ожидаемый срок службы SSD в своих данных SMART. Нивелирование износа граф является оценка состояния здоровья вашего диска. Он рассчитывается с использованием алгоритма, который учитывает предопределенное ожидаемое время жизни и количество циклов (запись, стирание и т. д.), Которые каждый флэш-блок памяти может выполнить до достижения своего конца срока службы.
Disk temperature является весьма обсуждаемым параметром. Тем не менее считается, что значения выше 60 ° C могут сократить срок службы жесткого диска или твердотельного накопителя и увеличить вероятность повреждения. Мы рекомендуем использовать вентилятор для понижения температуры ваших дисков и, возможно, продлить срок их службы.

Вышеупомянутые атрибуты SMART относительно легко интерпретировать. Если вы заметили увеличение их значений, возможно, ваш диск выходит из строя, поэтому лучше начать резервное копирование. Однако, хотя это и полезные показатели надежности привода, не забывайте, что они не являются надежными.

Встроенные функции самоконтроля (self-test)

Практически с момента появления стандарта S.M.A.R.T. II, в большинстве накопителей появилась новая функция — внутренняя диагностика и самоконтроль, для углубленного контроля состояния механики накопителя, поверхности дисков и т.п. Для запуска этой функции, в набор команд S.M.A.R.T. была введена новая команда — SMART EXECUTE OFF-LINE IMMEDIATE. Результат работы сохраняется либо в специализированных атрибутах, либо отдельным параметром среди других данных в атрибутах. Если накопитель поддерживает журналы S.M.A.R.T., то результат выполнения тестов сохраняется также в журнале . После выполнения теста, накопитель в обязательном порядке обновляет показания во всех атрибутах и других параметрах. Если во время выполнения внутреннего теста накопитель получит по интерфейсу новую команду, то выполнение теста прерывается и накопитель приступает к обработке поступившей команды.

1.6.1. Методы тестирования
Существует два способа запуска тестов S.M.A.R.T.: автономный (off-line) или монопольный (captive). Результат теста всегда сохраняется накопителем в данных S.M.A.R.T. При автономном запуске накопитель сообщает о успешном завершении команды ДО ее ФАКТИЧЕСКОГО исполнения и только после этого выполняет тест. При этом, по интерфейсу флаг ЗАНЯТО (BSY) не выставляется и накопитель в любой момент готов приступить к выполнению очередной интерфейсной команды, приостанавливая работу теста. Фактически, тест выполняется в фоновом режиме. При запуске теста в монопольном режиме, по интерфейсу выставляется флаг ЗАНЯТО (BSY) и накопитель начинает непосредственное выполнение теста в режиме реального времени. Любая интерфейсная команда во время выполнения этого теста приведет к его прерыванию и остановке, после чего накопитель приступит к обработке поступившей команды.

1.6.2. Разновидности тестов S.M.A.R.T.
Официально документированы три вида внутренних тестов, однако еще существует набор так называемых «активных» тестов, функциональные особенности которых различны у разных производителей и для широкой публики не документированы.

№	Название теста	off-line	captive
1	Off-line collection	+	—
2	Short Self-test	+	+
3	Extended Self-test	+	+
4	Drive Activity test #1..#4	+	+

Время тестирования может варьироваться от 1 секунды (Quantum) до 54 минут (Fujitsu MPG3409AT). Поддержка первого теста наиболее вероятна даже в очень старых накопителях 4-5 летней давности.
Второй и третий тесты появились относительно недавно, как дань внедренным сложным технологическим решениям — для полного контроля состояния накопителя пришлось реализовывать более глубокие и точные тесты. Поддержка 4-х «активных» тестов (см. таблицу, п.4) официально не документированна.

Реальный набор выполняемых тестами функций можно рассмотреть на примере тестов, поддерживаемых жесткими дисками Hitachi:

Функция теста	Short Self test	Extended Self test	Off-line Collection
Raw Read Error Rate Test	YES	YES	YES
Write Test	YES	YES	NO
Servo Test	YES	YES	NO
Partial Read Scanning	YES	NO	NO
Full Read Scanning	NO	YES	YES

Этот перечень тестов не является одинаковым для всех накопителей и приведен лишь в качестве примера.

Что делать с ошибками S.M.A.R.T.

Ответ на этот вопрос зависит от характера проблем с винчестером и степени его неисправности.

Прекратите использование сбойного HDD

Если на жестком диске уже появились битые сектора, это говорит о его значительном износе. Фактически он уже начал рассыпаться, и остановить этот процесс невозможно. Дальнейшее использование такого HDD чревато потерей данных. Поскольку причина этого – физическая неисправность устройства, восстановить их скорее всего не получится.

Восстановите удаленные данные диска

Информация с носителя может исчезать и вследствие логических ошибок (они могут возникать при повреждении файловой системы. В таком случае пропавшие в результате сбоя данные подлежат восстановлению (если они не были перезаписаны другими данными), поскольку физические повреждения на жестком диске отсутствуют. Их можно восстановить, например, с помощью программы R-Studio, которая позволяет спасти информацию даже с удаленных или отформатированных разделов.

Просканируйте диск на наличие битых секторов

Проверить HDD на битые сектора можно с помощью стандартных средств Windows. Для этого необходимо перейти к нужному диску (или разделу), вызвать его контекстное меню и открыть пункт «Свойства». Затем на вкладке «Сервис» кликнуть по кнопке «Выполнить проверку» и в открывшемся окне поставить галочки «Автоматически исправлять системные ошибки» и «Проверять и восстанавливать поврежденные сектора». Возможно, потребуется перезагрузка компьютера после нажатия кнопки «Запуск». Проверка очень объемных винчестеров может длиться до нескольких часов. После завершения процедуры логические ошибки будут исправлены, а bad-сектора подвергнуты ремапу (если их резерв еще не исчерпан).

Сканирование может быть выполнено и рядом сторонних приложений. Для этого отлично подходит программа Victoria. Чтобы полностью проверить весь винчестер на битые сектора, следует на вкладке «Standard» выбрать HDD, а затем перейти на вкладку «Tests» и нажать там кнопку «Start». Количество найденных сбойных секторов будет отображаться в процессе сканирования справа от синего прямоугольника, обозначенного «Err». Цифры рядом с красным и оранжевым прямоугольниками – это еще рабочие сектора, но скорость доступа к ним очень низкая (небольшое их количество может находиться даже на новом винчестере). Полная проверка может продолжаться несколько часов.

Снизьте температуру диска

Перегрев жесткого диска может оказывать негативное влияние на работу его механических компонентов и электроники. Поэтому при подъеме его температуры до 55ºC и выше ему требуется дополнительное охлаждение. Для снижения температуры устройства можно установить в корпус компьютера еще один вентилятор. Также существуют специальные вентиляторы, предназначенные для охлаждения винчестеров. Наконец, температуру накопителя можно немного понизить, если отключить установленные в корпус ПК устройства, выделяющие тепло, без которых можно некоторое время обойтись (например, второй HDD или видеокарта в случае наличия в системной плате интегрированной видеокарты).

Произведите дефрагментацию жесткого диска

Замедление скорости чтения и записи на диск зачастую обусловлено высокой степенью фрагментации хранящихся на нем файлов. Сильная фрагментация файловой системы может способствовать ускоренному износу блока магнитных головок. Это приведет к дополнительным проблемам, связанным с ухудшением показателей их позиционирования, а также с ростом температуры накопителя (поскольку файлы разбиваются на фрагменты, зачастую расположенные друг от друга на значительном удалении, магнитным головкам приходится выполнять дополнительные перемещения, что увеличивает выделение тепла).

Для предотвращения этих проблем следует выполнить дефрагментацию диска. Для этого нужно зайти в его свойства (путем вызова контекстного меню), перейти на вкладку «Сервис» и нажать на кнопку «Оптимизировать» (в Windows 10). Затем установить курсор на нужный диск или раздел и уже в этом окне кликнуть по кнопке «Оптимизировать». Обычно процедура оптимизации продолжается несколько минут.

Приобретите новый жесткий диск

Если количество сбойных секторов превышает резерв для их переназначения, приближается к этому показателю или неуклонно возрастает, следует позаботиться о покупке нового винчестера. После покупки надо как можно быстрее установить на него операционную систему и скопировать всю информацию, пока ее считывание еще возможно.

History and predecessors

An early hard disk monitoring technology was introduced by IBM in 1992 in its IBM 9337 Disk Arrays for AS/400 servers using IBM 0662 SCSI-2 disk drives. Later it was named Predictive Failure Analysis (PFA) technology. It was measuring several key device health parameters and evaluating them within the drive firmware. Communications between the physical unit and the monitoring software were limited to a binary result: namely, either «device is OK» or «drive is likely to fail soon».

Later, another variant, which was named IntelliSafe, was created by computer manufacturer Compaq and disk drive manufacturers Seagate, Quantum, and Conner. The disk drives would measure the disk’s «health parameters», and the values would be transferred to the operating system and user-space monitoring software. Each disk drive vendor was free to decide which parameters were to be included for monitoring, and what their thresholds should be. The unification was at the protocol level with the host.

Compaq submitted its implementation to the Small Form Factor (SFF) committee for standardization in early 1995. It was supported by IBM, by Compaq’s development partners Seagate, Quantum, and Conner, and by Western Digital, which did not have a failure prediction system at the time. The Committee chose IntelliSafe’s approach, as it provided more flexibility. The resulting jointly developed standard was named SMART.

That SFF standard described a communication protocol for an ATA host to use and control monitoring and analysis in a hard disk drive, but did not specify any particular metrics or analysis methods. Later, «SMART» came to be understood (though without any formal specification) to refer to a variety of specific metrics and methods and to apply to protocols unrelated to ATA for communicating the same kinds of things.

Теперь разберем по порядку, что означают эти атрибуты S.M.A.R.T

Все описывать ни к чему т.к. некоторые из них вообще по сараю обычному пользователю.

Raw read error rate – количество ошибок при чтении. Ошибки при чтении присутствуют абсолютно у всех винтов и любой hdd исправляет их автоматически. Если это значение равно нулю или нескольким единицам, то производитель просто решил не указывать количество этих ошибок.

У Fujitsu, Seagate, Samsung (начиная с SpinPoint F1) эти цифры очень внушительные, но это вполне нормально, просто в этих винтах указана немного другая система подсчета. Если имеете дело с одним из этих винтов, то на этот атрибут вообще рекомендую забить.

Полезным этот атрибут может быть для владельцев WD и Samsung (до SpinPoint F1) – если значение не равно нулю, то это может указывать на проблемы с диском. На Hitachi этот атрибут настораживает только если цифры действительно большие.

Spin—Up Time – время раскрутки диска в последний раз при включении. В принципе, вообще ни о чем не говорит.

StartStop Count – количество включений. Вообще никоим образом не влияет на здоровье диска.

Reallocated Sector Count – количество секторов, которые винчестер переназначил в резервную область. Очень важный параметр и напрямую указывает на состояние. На каждом винте предусмотрена резервная область на случай, когда сектора выходят из строя. В таких ситуациях он переносит информацию с умирающих секторов на резервные и они их заменяют. Но это уже признак того, что винт потихоньку накрывается. Не повод бить тревогу, если это свой винчак, но покупать такой уже не стОит.

Seek Error Rate – практически то же самое, что и Raw Read Error Rate, только там при чтении, а тут при позиционировании головок.

Power on Hours Count — количество часов работы диска. Ни о чем не говорит т.к. он мог тупо отдыхать включенным все это время, а мог пистонить где-то на сервере не затыкаясь месяцами подряд.

Spin Retry Count – количество повторных запусков шпинделя после неудачных попыток. Обычно это из-за проблем с БП, скачках напряжения, или трабл с кабелем питания. Если значения в пределах 2-3, то можно забить.

Power Cycle Count – количество включений/выключений диска. Ни о чем.

End to End Error Detection – количество ошибок при передаче данных через кэш винта. Довольно важный параметр, значение должно быть нулевым, иначе диск явно проблемный.

Количество неисправимых О)))) – Ошибки при чтении, которые винт не восстановил. Желательно чтоб значение было нулевым, но такого рода ошибки могут случаться по вине другого железа.

Command Timeout – количество операций, прерванных из-за превышения времени отклика. Чаще такое возникает из-за плохих кабелей, контроллеров Sata, материнок и т.д., но все же не факт, и здесь стоило бы быть повнимательнее.

Неизвестный атриб… — HDDTunePRO тупит)))

G—sense error rate – количество зафиксированных ошибок по причине внешних факторов, таких как падение, удары, рукожопый хозяин и т.д. Но зачастую датчики слишком чувствительны и срабатывают практически без причины, от не особо сильного стука даже не по столу, а просто в комнате.

Unsafe shutdown count – количество небезопасных выключений. Сам по себе этот параметр не говорит о состоянии диска.

Load cycle count – количество парковок/распарковок головки. О здоровье винта не говорит.

Аппаратное восстановление данных – количество ошибок, успешно восстановленных средствами HDD. Число должно соответствовать первому атрибуту (Raw Read Error Rate).

Current pending sector – количество нестабильных секторов. Они еще не считаются поврежденными, но по тем или иным причинам считаются подозрительными. Если дальше сектор читается успешно, то он исключается из числа нестабильных, так что это количество может варьироваться.

Offline Uncorrectable – то же, что и “pending”, но методы анализа несколько отличаются.

Interface CRC Error Count – количество ошибок в режиме UltraDMA, связанных с интерфейсом/разъемом/контроллером SATA. К состоянию жесткого диска этот атрибут не имеет отношения.

Write Error Rate – в этой проге нет этого показателя, но в общем-то он довольно важен. Указывает на ошибки при записи на диск.

На этом, пожалуй, можно закончить. SMART содержит еще некоторые атрибуты, но о здоровье винта они совсем ничего не говорят. Самые важные это:

Reallocated Sector Count

Write Error Rate

Current pending sector

Вообще, жесткий диск — это самая изнашиваемая деталь в компьютере, так что бывший в употреблении это та еще лотерея, и перед покупкой рекомендуем почитать отзывы обладателей той или иной модели, причем, указывать нужно конкретную модель, а не просто похожую. У всех производителей есть как удачные девайсы, так и откровенное дерьмо, так что не стоит доверять брендам только за их популярность.

Надеюсь, эта статья будет полезной. Удачной покупки)

А теперь немного о параметрах, выводимых программой.

Каждый атрибут имеет величину — Value. Value Изменяется в диапазоне от 0 до 255 (задается производителем). Низкое значение говорит о быстрой деградации диска или о возможном скором сбое. т.е. чем выше значение Value атрибута, тем лучше.

Raw Value — это значение атрибута во внутреннем формате производителя значение малоинформативно для всех кроме сервисманов.

Threshold — минимальное возможное значение атрибута, при котором гарантируется безотказная работа накопителя.

Если VALUE стало меньше THRESH — Атрибут считается failed и отображается в столбце WHEN_FAILED. При значении атрибута меньше Threshold очень вероятен сбой в работе или полный отказ.

WORST — минимальное нормализованное значение. Это минимальное значение которое достигалось с момента включения SMART на диске.

Атрибуты бывают критически важными (Pre-fail) и некритически важными (Old_age)

Выход критически важного параметра за пределы Threshold фактический означает выход диска из строя, выход за переделы допустимых значений некритически важного параметра свидетельствует о наличии проблемы, но диск может сохранять свою работоспособность

Критичные атрибуты:

Raw Read Error Rate — частота ошибок при чтении данных с диска, происхождение которых обусловлено аппаратной частью диска.Spin Up Time — время раскрутки пакета дисков из состояния покоя до рабочей скорости. При расчете нормализованного значения (Value) практическое время сравнивается с некоторой эталонной величиной, установленной на заводе. Не ухудшающееся немаксимальное значение при Spin Up Retry Count Value = max (Raw равном 0) не говорит ни о чем плохом. Отличие времени от эталонного может быть вызвано рядом причин, например просадка по вольтажу блока питания. Spin Up Retry Count — число повторных попыток раскрутки дисков до рабочей скорости, в случае если первая попытка была неудачной. Ненулевое значение Raw (соответственно немаксимальное Value) свидетельствует о проблемах в механической части накопителя. Seek Error Rate — частота ошибок при позиционировании блока головок. Высокое значение Raw свидетельствует о наличии проблем, которыми могут являться повреждение сервометок, чрезмерное термическое расширение дисков, механические проблемы в блоке позиционирования и др. Постоянное высокое значение Value говорит о том, что все хорошо. Reallocated Sector Count — число операций переназначения секторов. SMART в современных дисках способен произвести анализ сектора на стабильность работы «на лету» и в случае признания его сбойным, произвести его переназначение.

Некритичные атрибуты:

Start/Stop Count — полное число запусков/остановов шпинделя. Гарантировано мотор диска способен перенести лишь определенное число включений/выключений. Это значение выбирается в качестве Treshold. Первые модели дисков со скоростью вращения 7200 оборотов/мин имели ненадежный двигатель, могли перенести лишь небольшое их число и быстро выходили из строя. Power On Hours — число часов проведенных во включенном состоянии. В качестве порогового значения для него выбирается паспортное время наработки на отказ (MTBF). Обычно величина MTBF огромна, и маловероятно, что этот параметр достигнет критического порога. Но даже в этом случае выход из строя диска совершенно не обязателен. Drive Power Cycle Count — количество полных циклов включения-выключения диска. По этому и предыдущему атрибуту можно оценить, например, сколько использовался диск до покупки. Temperatue — Здесь хранятся показания встроенного термодатчика. Температура имеет огромное влияние на срок службы диска (даже если она находится в допустимых пределах). Вернее имеет влияние не на срок службы диска а на частоту возникновения некоторых типов ошибок, которые влияют на срок службы. Current Pending Sector Count — Число секторов, являющихся кандидатами на замену. Они не были еще определенны как плохие, но считывание их отличается от чтения стабильного сектора, так называемые подозрительные или нестабильные сектора. Uncorrectable Sector Count — число ошибок при обращении к сектору, которые не были скорректированы. Возможными причинами возникновения могут быть сбои механики или порча поверхности. UDMA CRC Error Rate — число ошибок, возникающих при передаче данных по внешнему интерфейсу. Могут быть вызваны некачественными кабелями, нештатными режимами работы. Write Error Rate — показывает частоту ошибок происходящих при записи на диск. Может служить показателем качества поверхности и механики накопителя.