Google, Seagate AI ідентифікує проблемні жорсткі диски, перш ніж вони не зможуть

Google, Seagate AI ідентифікує проблемні жорсткі диски, перш ніж вони не зможуть

Google і Seagate оголосили, що вони створюють модель машинобудування, призначеної для прогнозування, коли жорсткий диск, ймовірно, помре. Це питання - і ми всі запитали його в той чи інший час - напрочуд важко відповісти, навіть для компаній, як Google, з доступом до Reams даних про поведінку мільйонів жорстких дисків у центрах даних за останні 20 років років.

Повідомлення Google Blog оголошує це зусилля, не робить найкращої роботи, що ілюструє складність завдання під рукою. Там є пост блогу 2016 року з BackBlaze обговорюючи систему Smart Attributes для жорстких дисків, яка пропонує якусь цінну додаткову інформацію про сферу цієї проблеми.

Ще в 2016 році Backblaze відстежує п'ять різних смарт-атрибутів для прогнозування невдалого жорсткого диска. Компанія виявила, що п'ять атрибутів - SMART 5, 187, 188, 197, 198 - добре співвідносяться з невдалою приводу. 76,7% HDDS, які не вдалося за відповідний період, мали принаймні одну розумну невдачу у цих п'яти атрибутах. Лише 4,2 відсотка операційних жорстких дисків повідомили про невдачу в одному або декількох з цих п'яти атрибутів.

Спроби знайти сильні кореляції між п'яти атрибутами, однак, виявилися складними.

Google, Seagate AI ідентифікує проблемні жорсткі диски, перш ніж вони не зможуть

Ця діаграма показує шанс, що невдача в будь-якому заданому смарт-атрибуту відповідає невдачі в іншій з інших п'яти атрибутів. Тільки два атрибути корелюють добре - Smart 197 та Smart 198. Smart 188 і Smart 187 майже не мають кореляції взагалі.

Однак одна річ відзначають у своїй доповіді, полягає в тому, що моделі помилок відрізняються, якщо ви вивчаєте диски, де помилки нараховуються повільно з часом у порівнянні з приводами, де помилки з'явилися раптово. Загальна дискусія Backblaze дає зрозуміти, що жонглювання навіть скромна жменька смарт-атрибутів була складною у 2016 році.

Сьогодні Google та Seagate збирають невизначену кількість інтелектуальних даних, у поєднанні з даними хостів з приймаючих систем, що складаються з декількох дисків, журналів HDD (OVD та FARM), а також виготовлення даних з дисків, включаючи номер моделі та пакетні числа. Хоча ми не можемо сказати напевно, це виглядає так, ніби Google та Seagate збирають набагато більше інформації, ніж те, що було працювати з п'ять років тому.

За словами Google, вона оцінила два різних підходи: класифікатор автомат-таблиць та звичайна модель "глибокого трансформатора". Модель Automl фактично працювала краще, з точністю 98 відсотків та відкликання 35 відсотків.

Ось що це означає: уявіть, що запускає пошук Google для даної теми. Точність вимірює, скільки з посилань кашлю пошукової системи фактично має значення для цілей вашого пошуку. Нагадаємо, навпаки, заходи, скільки відповідних зв'язків були вилучені з усіх відповідних документів, які потенційно існують. Документація Google пропонує думку про різницю таким чином:

Точність: "Яка частка позитивних ідентифікацій була фактично правильна?" (98 відсотків, у цьому випадку).

Нагадаємо: "Яку частку фактичних позитивів була правильно?"

Є компроміс між точністю та відкликанням. Ці два іноді об'єднуються в метрику, відомі як F-оцінка, яка вимірює точність тесту. Ми не знаємо, який тип F-Ocle Weights Google може подати заявку, але оцінка F1 буде гармонійним значенням точності та відкликання. Якщо ми виконуємо заявлені значення Google, то II IT побудований виконує ледве краще, ніж випадковий шанс, при 0.5158, де A 1.0 вказує на ідеальну точність та відкликання, а 0 вказує, що у вас є реальна проблема з випускною темою. Модель за замовчуванням з 20-25% відкликання виконує гірше, ніж випадковий шанс, на 0.3984.

Однак, результати блогу Google означає, що результати компанії були кращими, ніж випадкові випадки. Компанія пише, що нова модель AI дозволила йому виявити головні причини невдачі приводу ", - дозволяючи групові команди робити проактивні дії, щоб зменшити невдачі в операціях, перш ніж вони сталися."

Google не дає додаткової контекстної інформації про те, що нагадує, що вона хоче, або якщо 35 відсотків достатньо. Він закінчується: "Ми вже маємо плани розширити систему, щоб підтримати всі моди Seagate, і ми не можемо чекати, щоб побачити, як це буде корисним нашим OEM та нашим клієнтам!"

Дійсно. Все, що може допомогти виробникам виявити невдачі жорсткого диска, перш ніж вони стануть популярним продуктом.

Кредит: Патрік Лінденберг на непривабливих

Читати далі

Chromebook отримують частку ринку, оскільки освіта переходить в Інтернет
Chromebook отримують частку ринку, оскільки освіта переходить в Інтернет

Продажі Chromebook зросли в пандемії, продажі зросли на 90 відсотків, і очікується майбутнє зростання. Це ставить певні виклики для таких компаній, як Microsoft.

Нова серія Radeon RX 6000 від AMD оптимізована для бойового ампера
Нова серія Radeon RX 6000 від AMD оптимізована для бойового ампера

AMD сьогодні представила свою серію RX 6000. Вперше з моменту придбання ATI в 2006 році, існуватимуть певні переваги в роботі графічних процесорів AMD на платформах AMD.

Огляд Xbox Series X: Ігровий ПК для вітальні, який я (переважно) завжди хотів
Огляд Xbox Series X: Ігровий ПК для вітальні, який я (переважно) завжди хотів

Серія Xbox X виходить через п’ять днів, і ми можемо про це говорити. Я ніколи раніше не робив огляд консолі, тому я пішов на це з точки зору того, до чого я звик - ігор на ПК. Тут об’єктивно Microsoft має чим пишатися.

Археологи виявляють втрачені єгипетське місто, сказав, що конкурує Помпеї
Археологи виявляють втрачені єгипетське місто, сказав, що конкурує Помпеї

Єгипетські археологи знайшли втрачене місто в Єгипті біля долини королів. Зростання Атена кажуть, що конкурує Помпеї з точки зору повноти та збереження, і може розповісти нам набагато більше, ніж ми зараз знаємо про єгипетську культуру та суспільство, близько 1330 р. До н.е.