Nvidia розчаровує себе, щоб взяти Crown Benchmark AI

Nvidia розчаровує себе, щоб взяти Crown Benchmark AI

Однією з складних частин відновлення інновацій в апаратному забезпеченні AI є те, що кожен постачальник демонструє програми та контрольні показники, які виявляють найкращі у своїх продуктах. Оскільки поле є відносно новим, не було ніяких корисних, широких критеріїв для порівняння. ImageNet є одним багаторічним улюбленим, але з багатьма новими додатками та мережевими архітектурами, розгортання яких простим розпізнаванням об'єктів в 2D-зображеннях не говорить нам про те, яке устаткування найшвидше, або найкраще для інших робочих навантажень.

Тепер команда гігантських компаній, включаючи компанії Google, Intel, Baidu та Nvidia, підійшла до ранньої версії (наразі версії 5.0) MLPerf, набору тестів для машинного навчання, що включає навчання різноманітних мереж . Nvidia оголосила про те, що вона перевершила початкові результати, але копання в деталях показує, що це була чи не єдине місце в грі. Якщо нічого іншого, це показує, наскільки домінуючим є виробник графічних процесорів на ринку ІС.

MLPerf v0.5: Покриття набережної прив'язки

В даний час MLPerf складається з тестів, що тренують часову мережу в семи областях застосування, починаючи з класичного резервування тренувань ResNet-50 на ImageNet. Він додає легкий і важкоатлетичний виявлення об'єктів (COCO), рекурентний та неперервний переклад (WMT E-G), рекомендації (MovieLens-20M) та навчальне зміцнення (Mini Go). Єдиною платформою з результатами для всіх семи є еталонне відтворення, яке виконується на Pascal P100. Орієнтири для впорядкування заплановані на майбутні версії.

Більшість результатів Nvidia було запущено на одному або декількох суперкомп'ютерів DGX-1 або DGX-2, а Google - на процесорах v2 і v3 TPU. Intel представила кілька образів ImageNet для свого SKX 8180, але жоден з них не був дуже конкурентним. Проте, системи, що використовують його $ 10K, 28-core, SKX 8180, були єдиним конкурентним поданням у категорії "Підвищення кваліфікації". Ця категорія, швидше за все, буде недовговічною, коли з'явиться версія, що не пов'язана із процесором, доступної для цього еталону.

З достатньою кількістю високопродуктивних графічних процесорів навчання нейронної мережі набагато менш болісне. Ці результати становлять від 2 до 10 разів швидше, ніж найшвидший результат з одного вузла.
З достатньою кількістю високопродуктивних графічних процесорів навчання нейронної мережі набагато менш болісне. Ці результати становлять від 2 до 10 разів швидше, ніж найшвидший результат з одного вузла.
Nvidia розчаровує себе, щоб взяти Crown Benchmark AI

Те, що це дійсно показує, що обладнання Nvidia домінує AI

На практиці більшість тренувань AI виконується на апаратних засобах Nvidia. Не тільки внаслідок цінової продуктивності своїх графічних процесорів, але також через поширеність інструментів на базі CUDA. Отже, поки Google представив деякі орієнтири для свого TPU, його чіпи спочатку були побудовані як інструмент впорядкування, і тільки в останньому поколінні почали використовуватися для підготовки завдань. Подібним чином, до цих пір AMD ніде не знаходитиметься в результатах тесту, хоча AMD є одним із перелічених сторонників зусиль MLPerf, так що це, імовірно, зміниться. У той же час, Nvidia в значній мірі конкурує з самим собою.

Читати далі

Перші настільні орієнтири Intel Arc A380 розчаровують
Перші настільні орієнтири Intel Arc A380 розчаровують

Перші орієнтири для настільного GPU ARC A380 Intel були опубліковані китайським рецензентом, і вони не виглядають добре для Intel.