Google, Seagate AI идентифицирует проблему жестких дисков, прежде чем они потерпят неудачу

Google, Seagate AI идентифицирует проблему жестких дисков, прежде чем они потерпят неудачу

Google и Seagate объявили, что они строят модель обучения машины, предназначенную для прогнозирования, когда жесткий диск может умереть. Этот вопрос - и мы все спросили его одновременно или другому - удивительно усердно ответить, даже для компаний, таких как Google, с доступом к разрядам данных о поведении миллионов жестких дисков в его дата-центрах за последние 20 годы.

Сообщение Google Blog объявляет об этих усилиях, не выполняет лучшую работу, иллюстрирующую сложность задачи под рукой. От Backblaze есть сообщение в блоге 2016 года из Backblaze, обсуждая систему интеллектуального атрибута для жестких дисков, которые предлагают некоторую ценную дополнительную информацию о объеме этой проблемы.

Вернувшись в 2016 году, Backblaze отслеживал пять различных умных атрибутов для прогнозирования сбоя жесткого диска. Компания обнаружила, что пять атрибутов - Smart 5, 187, 188, 197 и 198 - хорошо коррелировали с провалом диска. 76,7% HDDS, которые провалились в течение соответствующего периода, имели по меньшей мере один интеллектуальный сбой в этих пятих атрибутах. Только 4,2 процента оперативных жестких дисков сообщили о неудаче в одном или нескольких из этих пяти атрибутов.

Попытки найти сильные корреляции между пятью атрибутами, однако, оказались сложными.

Google, Seagate AI идентифицирует проблему жестких дисков, прежде чем они потерпят неудачу

Этот график показывает вероятность того, что отказ в любом данном интеллектуальном атрибуте соответствует сбою в другом из других пяти атрибутов. Только два атрибута коррелируют хорошо - Smart 197 и Smart 198. Smart 188 и Smart 187 практически не имеют корреляции вообще.

Одна вещь BackbLaze Notes в своем отчете, однако, заключается в том, что шаблоны ошибок отличаются, если вы изучите диски, в которых ошибки медленно начисляются со временем против дисков, где ошибки появлялись внезапно. Общая общая дискуссия Backblaze позволяет понять, что жонглирование даже скромной горстки умных атрибутов было сложно еще в 2016 году.

Сегодня, Google и Seagate собирают неопределенное количество смартвых данных, в сочетании с данными хоста из хост-систем состоит из нескольких дисков, HDD Logs (OVD и фермы), а также изготовление данных выключения дисков, включая номер модели и номера партии. Хотя мы не можем сказать наверняка, выглядит как будто Google и Seagate собирают гораздо больше информации, чем то, что Backblaze работал с пять лет назад.

Согласно Google, он оценил два разных подхода: классификатор столов AutoStable и пользовательской «глубокой трансформаторной» моделью. Модель автомашины фактически работала лучше, с точностью до 98 процентов и отзыв 35 процентов.

Вот что означает: представьте себе запуску поиска Google для данной темы. Точность измеряет, сколько ссылок на поисковую систему кашляет фактически важным для целей вашего поиска. Напомним, напротив, измеряет, сколько соответствующих ссылок были извлечены из всех соответствующих документов, которые потенциально существуют. Документация Google предлагает думать о разнице таким образом:

Точность: «Какая доля положительных идентификаций была фактически правильной?» (98 процентов, в этом случае).

Напомним: «Какая доля фактических позитивов была идентифицирована правильно?»

Существует компромисс между точностью и вспомогательным. Два иногда объединяются в метрику, известную как F-оценка, что измеряет точность теста. Мы не знаем, на каких весах F-оценки могут применяться Google Google, но балл F1 будет гармоническим средством точности и отзыва. Если мы пробиваем заявленные значения Google в, AI он построил, что он едва работает лучше, чем случайный шанс, на 0,5158, где A 1.0 указывает на идеальную точность и отзыв, а A 0 указывает, что у вас есть реальная проблема с вашим выпускным тезисом. Модель по умолчанию с 20-25 процентным отзывом выполняет хуже, чем случайный шанс, на 0,3984.

Пост Google Blog подразумевает, что результаты компании были лучше, чем случайный шанс. Компания пишет, что новая модель AI позволила ее определить главные причины сбоев привода, «включение наземных команд предпринимать активные действия, чтобы уменьшить неудачи в операциях, прежде чем они произошли».

Google не предоставляет никакой дополнительной контекстуальной информации о том, что требует его требует, или если на 35 процентов достаточно. Он заканчивается: «У нас уже есть планы расширить систему, чтобы поддержать все диски Seagate - и мы не можем дождаться, чтобы увидеть, как это будет принесет пользу нашим умам и нашим клиентам!»

Действительно. Все, что может помочь производителям обнаруживать сбои жесткого диска, прежде чем они произойдут, будет популярным продуктом.

Кредит: Патрик Линденберг на Unsplash

Читать далее

Western Digital меняет заявленные скорости дисков, чтобы отразить реальность
Western Digital меняет заявленные скорости дисков, чтобы отразить реальность

Western Digital выпустила новые модели WD Red Plus, чтобы исправить ранее сообщенные неточности в отношении скорости вращения шпинделя в своих продуктах этого семейства на 8–14 ТБ.

Человек получает 15-месячное предложение для продажи дисков восстановления Windows
Человек получает 15-месячное предложение для продажи дисков восстановления Windows

Лундгрен, известный переработчик электронных отходов, говорит, что он сделал диски, чтобы помочь людям исправить свои старые компьютеры, а не бросить их, и он беспокоится о прецеденте, который был установлен.

Google заменяет хранилище дисков более щедрыми планами Google One
Google заменяет хранилище дисков более щедрыми планами Google One

Google в последний раз обновил свои планы хранения в 2014 году в ответ на падение цен от конкурента Dropbox, и теперь это делает цены еще более конкурентоспособными.

OEM-производители ПК продают ноутбуки с помощью дискотечных приводов и заявляют, что это память
OEM-производители ПК продают ноутбуки с помощью дискотечных приводов и заявляют, что это память

Несколько OEM-производителей - это системы маркетинга, как будто их общая загрузка памяти эквивалентна их фактическому кэшу DRAM + Optane. Это не так.