Каскадне озеро Intel зі збільшенням DL піднімається головою з титаном RTX Nvidia в тестах AI

Каскадне озеро Intel зі збільшенням DL піднімається головою з титаном RTX Nvidia в тестах AI

Протягом останніх декількох років Intel розмовляє своїми серверами Cascade Lake з DL Boost (також відомим як VNNI, Vector Neural Net Instructions). Ці нові можливості є підмножиною AVX-512 і призначені спеціально для прискорення продуктивності процесора в додатках AI. Історично багато програм AI надавали перевагу графічним процесорам над процесорами. Архітектура графічних процесорів - масово паралельних процесорів з низькою однопотоковою продуктивністю - набагато краще підходила для графічних процесорів, а не для процесорів. Процесори пропонують набагато більше ресурсів для виконання на одному потоці, але навіть сьогоднішні багатоядерні процесори спотворені паралелізмом, доступним у високоякісному ядрі GPU.

Anandtech порівняв продуктивність Cascade Lake, Epyc 7601 (незабаром його перевершать 7nm-процесорні процесори AMD, але все ще є провідним серверним ядром AMD сьогодні) та RTX Titan. Стаття, відмінна Йохан Де Гелас, розповідає про різні типи нейронних мереж за межами CNN (Convolutional Neural Networks), які, як правило, орієнтовані, а також про те, як ключовою частиною стратегії Intel є конкуренція проти Nvidia в робочих навантаженнях, де GPU не настільки сильні. або ще не може обслуговувати виникаючі потреби ринку через обмеження в ємності пам’яті (GPU все ще не можуть відповідати процесорам тут), використання «легких» AI-моделей, які не потребують тривалого часу навчання, або AI-моделей, які залежать від статистичні моделі нейронної мережі.

Зростання доходів від центрів обробки даних є найважливішим компонентом загального поштовху Intel у галузі ІІ та машинного навчання. Тим часом Nvidia прагне захистити ринок, на якому зараз конкурує практично поодинці. Інтелектуальна стратегія Intel є широкою і охоплює багато продуктів: від Movidius та Nervana до DL Boost на Xeon, до майбутньої лінійки графічних процесорів Xe. Nvidia прагне показати, що GPU можна використовувати для обчислення AI обчислень у більш широкому діапазоні навантажень. Intel будує нові можливості AI на існуючих продуктах, розробляючи нове обладнання, яке, сподіваємось, вплине на ринок, і намагається створити свій перший серйозний графічний процесор, щоб кинути виклик роботі AMD та Nvidia у споживчому просторі.

Що в цілому показують показники Anandtech, це те, що прогалина між Intel та Nvidia залишається широкою - навіть з DL Boost. На цьому графіку тестування періодичної нейронної мережі використовувалася мережа «Довга короткострокова пам'ять (LSTM)» як нейронна мережа. Тип RNN, LSTM вибірково «запам’ятовує» шаблони протягом певної тривалості часу. »Anandtech також використовувала три різні конфігурації для тестування цього - нестандартний Tensorflow з кондою, оптимізований Intel Tensorflow з PyPi та a версія Tensorflow оптимізована з джерела за допомогою Bazel, використовуючи найновішу версію Tensorflow.

Зображення: Anandtech
Зображення: Anandtech
Зображення: Anandtech
Зображення: Anandtech

Ця пара зображень фіксує відносне масштабування між процесорами, а також порівняння з RTX Titan. Ефективність поза AMD була досить поганою на AMD, хоча вона покращувалася за допомогою оптимізованого коду. Під час тестування версії, оптимізованої для джерел, продуктивність Intel зростала як ракета, але навіть оптимізована для джерела версія не дуже відповідала продуктивності Titan RTX. Де Гелас зазначає: "По-друге, ми були дуже вражені тим, що наш Titan RTX був у 3 рази швидшим, ніж наша подвійна установка Xeon", що розповідає вам про те, як ці порівняння проходять у більшій статті.

DL Boost недостатньо, щоб усунути розрив між Intel і Nvidia, але, чесно кажучи, цього ніколи не повинно було бути. Мета Intel тут - підвищити продуктивність AI на Xeon, щоб зробити запуск цих робочих навантажень правдоподібним на серверах, які в основному будуть використовуватися для інших речей, або при створенні AI-моделей, що не відповідають обмеженням сучасного GPU. Довгострокова мета компанії - конкурувати на ринку ШІ з різноманітним обладнанням, а не лише Xeons. З Xe ще не зовсім готовим, конкурувати в просторі HPC зараз означає конкурувати з Xeon.

Для тих, хто цікавиться питанням про AMD, AMD насправді не говорить про виконання робочих навантажень AI на процесорах Epyc, але зосередився на своїй ініціативі RocM для запуску коду CUDA на OpenCL. AMD не дуже розповідає про цю сторону свого бізнесу, але Nvidia домінує на ринку програм AI та HPC GPU. І AMD, і Intel хочуть простору. Зараз, здається, обидва борються в гору, щоб претендувати на одне.

Читати далі

Бета-тести швидкості Starlink бета-тестують традиційний супутниковий Інтернет
Бета-тести швидкості Starlink бета-тестують традиційний супутниковий Інтернет

За даними Ookla Speedtest та проаналізованими нашими колегами з PCMag, Starlink відповідає своїм високим вимогам щодо швидкості.

PS5 перевершує Xbox Series X у тестах, оскільки Sony обіцяє більше консолей
PS5 перевершує Xbox Series X у тестах, оскільки Sony обіцяє більше консолей

Сьогодні дві цікаві новини: PlayStation 5 продовжує бити над своєю ваговою категорією по відношенню до Xbox Series X, і Sony обіцяє, що отримає більше консолей на складі та в руки споживачів.

Тести, що просочились, малюють суперечливу картину Intel Rocket Lake
Тести, що просочились, малюють суперечливу картину Intel Rocket Lake

Чутки про Рокет-Лейк останнім часом вказують у двох протилежних напрямках, але більш конкурентоспроможні показники, швидше за все, будуть правдою.

Тести Cyberpunk 2077 показують, що навіть найшвидший графічний процесор у світі не може грати на 4K
Тести Cyberpunk 2077 показують, що навіть найшвидший графічний процесор у світі не може грати на 4K

Напевно, Cyberpunk 2077 не міг виправдати ажіотаж після восьми років розробки, але проблеми з продуктивністю не допомагають.