Google, Seagate AI ідентифікує проблемні жорсткі диски, перш ніж вони не зможуть

Google і Seagate оголосили, що вони створюють модель машинобудування, призначеної для прогнозування, коли жорсткий диск, ймовірно, помре. Це питання - і ми всі запитали його в той чи інший час - напрочуд важко відповісти, навіть для компаній, як Google, з доступом до Reams даних про поведінку мільйонів жорстких дисків у центрах даних за останні 20 років років.

Повідомлення Google Blog оголошує це зусилля, не робить найкращої роботи, що ілюструє складність завдання під рукою. Там є пост блогу 2016 року з BackBlaze обговорюючи систему Smart Attributes для жорстких дисків, яка пропонує якусь цінну додаткову інформацію про сферу цієї проблеми.

Ще в 2016 році Backblaze відстежує п'ять різних смарт-атрибутів для прогнозування невдалого жорсткого диска. Компанія виявила, що п'ять атрибутів - SMART 5, 187, 188, 197, 198 - добре співвідносяться з невдалою приводу. 76,7% HDDS, які не вдалося за відповідний період, мали принаймні одну розумну невдачу у цих п'яти атрибутах. Лише 4,2 відсотка операційних жорстких дисків повідомили про невдачу в одному або декількох з цих п'яти атрибутів.

Спроби знайти сильні кореляції між п'яти атрибутами, однак, виявилися складними.

Ця діаграма показує шанс, що невдача в будь-якому заданому смарт-атрибуту відповідає невдачі в іншій з інших п'яти атрибутів. Тільки два атрибути корелюють добре - Smart 197 та Smart 198. Smart 188 і Smart 187 майже не мають кореляції взагалі.

Однак одна річ відзначають у своїй доповіді, полягає в тому, що моделі помилок відрізняються, якщо ви вивчаєте диски, де помилки нараховуються повільно з часом у порівнянні з приводами, де помилки з'явилися раптово. Загальна дискусія Backblaze дає зрозуміти, що жонглювання навіть скромна жменька смарт-атрибутів була складною у 2016 році.

Сьогодні Google та Seagate збирають невизначену кількість інтелектуальних даних, у поєднанні з даними хостів з приймаючих систем, що складаються з декількох дисків, журналів HDD (OVD та FARM), а також виготовлення даних з дисків, включаючи номер моделі та пакетні числа. Хоча ми не можемо сказати напевно, це виглядає так, ніби Google та Seagate збирають набагато більше інформації, ніж те, що було працювати з п'ять років тому.

За словами Google, вона оцінила два різних підходи: класифікатор автомат-таблиць та звичайна модель "глибокого трансформатора". Модель Automl фактично працювала краще, з точністю 98 відсотків та відкликання 35 відсотків.

Ось що це означає: уявіть, що запускає пошук Google для даної теми. Точність вимірює, скільки з посилань кашлю пошукової системи фактично має значення для цілей вашого пошуку. Нагадаємо, навпаки, заходи, скільки відповідних зв'язків були вилучені з усіх відповідних документів, які потенційно існують. Документація Google пропонує думку про різницю таким чином:

Точність: "Яка частка позитивних ідентифікацій була фактично правильна?" (98 відсотків, у цьому випадку).
Нагадаємо: "Яку частку фактичних позитивів була правильно?"

Є компроміс між точністю та відкликанням. Ці два іноді об'єднуються в метрику, відомі як F-оцінка, яка вимірює точність тесту. Ми не знаємо, який тип F-Ocle Weights Google може подати заявку, але оцінка F1 буде гармонійним значенням точності та відкликання. Якщо ми виконуємо заявлені значення Google, то II IT побудований виконує ледве краще, ніж випадковий шанс, при 0.5158, де A 1.0 вказує на ідеальну точність та відкликання, а 0 вказує, що у вас є реальна проблема з випускною темою. Модель за замовчуванням з 20-25% відкликання виконує гірше, ніж випадковий шанс, на 0.3984.

Однак, результати блогу Google означає, що результати компанії були кращими, ніж випадкові випадки. Компанія пише, що нова модель AI дозволила йому виявити головні причини невдачі приводу ", - дозволяючи групові команди робити проактивні дії, щоб зменшити невдачі в операціях, перш ніж вони сталися."

Google не дає додаткової контекстної інформації про те, що нагадує, що вона хоче, або якщо 35 відсотків достатньо. Він закінчується: "Ми вже маємо плани розширити систему, щоб підтримати всі моди Seagate, і ми не можемо чекати, щоб побачити, як це буде корисним нашим OEM та нашим клієнтам!"

Дійсно. Все, що може допомогти виробникам виявити невдачі жорсткого диска, перш ніж вони стануть популярним продуктом.

Кредит: Патрік Лінденберг на непривабливих

Читати далі

Apple стирчить платників податків за рахунок нової служби цифрового ідентифікатора

Google, Seagate AI ідентифікує проблемні жорсткі диски, перш ніж вони не зможуть

Читати далі

Apple стирчить платників податків за рахунок нової служби цифрового ідентифікатора

Apple, нарешті, дозволяє ідентифікатор обличчя з масками в IOS 15.4 Beta

Чи має графічна дисципліна AMD проблеми з ідентифікацією?

Сили ФБР підозрюють, що розблокувати телефон, використовуючи ідентифікатор особи