Каскадне озеро Intel зі збільшенням DL піднімається головою з титаном RTX Nvidia в тестах AI

Каскадне озеро Intel зі збільшенням DL піднімається головою з титаном RTX Nvidia в тестах AI

Протягом останніх декількох років Intel розмовляє своїми серверами Cascade Lake з DL Boost (також відомим як VNNI, Vector Neural Net Instructions). Ці нові можливості є підмножиною AVX-512 і призначені спеціально для прискорення продуктивності процесора в додатках AI. Історично багато програм AI надавали перевагу графічним процесорам над процесорами. Архітектура графічних процесорів - масово паралельних процесорів з низькою однопотоковою продуктивністю - набагато краще підходила для графічних процесорів, а не для процесорів. Процесори пропонують набагато більше ресурсів для виконання на одному потоці, але навіть сьогоднішні багатоядерні процесори спотворені паралелізмом, доступним у високоякісному ядрі GPU.

Anandtech порівняв продуктивність Cascade Lake, Epyc 7601 (незабаром його перевершать 7nm-процесорні процесори AMD, але все ще є провідним серверним ядром AMD сьогодні) та RTX Titan. Стаття, відмінна Йохан Де Гелас, розповідає про різні типи нейронних мереж за межами CNN (Convolutional Neural Networks), які, як правило, орієнтовані, а також про те, як ключовою частиною стратегії Intel є конкуренція проти Nvidia в робочих навантаженнях, де GPU не настільки сильні. або ще не може обслуговувати виникаючі потреби ринку через обмеження в ємності пам’яті (GPU все ще не можуть відповідати процесорам тут), використання «легких» AI-моделей, які не потребують тривалого часу навчання, або AI-моделей, які залежать від статистичні моделі нейронної мережі.

Зростання доходів від центрів обробки даних є найважливішим компонентом загального поштовху Intel у галузі ІІ та машинного навчання. Тим часом Nvidia прагне захистити ринок, на якому зараз конкурує практично поодинці. Інтелектуальна стратегія Intel є широкою і охоплює багато продуктів: від Movidius та Nervana до DL Boost на Xeon, до майбутньої лінійки графічних процесорів Xe. Nvidia прагне показати, що GPU можна використовувати для обчислення AI обчислень у більш широкому діапазоні навантажень. Intel будує нові можливості AI на існуючих продуктах, розробляючи нове обладнання, яке, сподіваємось, вплине на ринок, і намагається створити свій перший серйозний графічний процесор, щоб кинути виклик роботі AMD та Nvidia у споживчому просторі.

Що в цілому показують показники Anandtech, це те, що прогалина між Intel та Nvidia залишається широкою - навіть з DL Boost. На цьому графіку тестування періодичної нейронної мережі використовувалася мережа «Довга короткострокова пам'ять (LSTM)» як нейронна мережа. Тип RNN, LSTM вибірково «запам’ятовує» шаблони протягом певної тривалості часу. »Anandtech також використовувала три різні конфігурації для тестування цього - нестандартний Tensorflow з кондою, оптимізований Intel Tensorflow з PyPi та a версія Tensorflow оптимізована з джерела за допомогою Bazel, використовуючи найновішу версію Tensorflow.

Зображення: Anandtech
Зображення: Anandtech
Зображення: Anandtech
Зображення: Anandtech

Ця пара зображень фіксує відносне масштабування між процесорами, а також порівняння з RTX Titan. Ефективність поза AMD була досить поганою на AMD, хоча вона покращувалася за допомогою оптимізованого коду. Під час тестування версії, оптимізованої для джерел, продуктивність Intel зростала як ракета, але навіть оптимізована для джерела версія не дуже відповідала продуктивності Titan RTX. Де Гелас зазначає: "По-друге, ми були дуже вражені тим, що наш Titan RTX був у 3 рази швидшим, ніж наша подвійна установка Xeon", що розповідає вам про те, як ці порівняння проходять у більшій статті.

DL Boost недостатньо, щоб усунути розрив між Intel і Nvidia, але, чесно кажучи, цього ніколи не повинно було бути. Мета Intel тут - підвищити продуктивність AI на Xeon, щоб зробити запуск цих робочих навантажень правдоподібним на серверах, які в основному будуть використовуватися для інших речей, або при створенні AI-моделей, що не відповідають обмеженням сучасного GPU. Довгострокова мета компанії - конкурувати на ринку ШІ з різноманітним обладнанням, а не лише Xeons. З Xe ще не зовсім готовим, конкурувати в просторі HPC зараз означає конкурувати з Xeon.

Для тих, хто цікавиться питанням про AMD, AMD насправді не говорить про виконання робочих навантажень AI на процесорах Epyc, але зосередився на своїй ініціативі RocM для запуску коду CUDA на OpenCL. AMD не дуже розповідає про цю сторону свого бізнесу, але Nvidia домінує на ринку програм AI та HPC GPU. І AMD, і Intel хочуть простору. Зараз, здається, обидва борються в гору, щоб претендувати на одне.

Читати далі

Раджа Кодурі від Intel представить на майбутній конференції Samsung Foundry
Раджа Кодурі від Intel представить на майбутній конференції Samsung Foundry

Цього тижня Раджа Кодурі від Intel виступить на ливарному заході Samsung - і це не те, що сталося б, якби Intel не мала чого сказати.

Нові відомості про Intel Rocket Lake: Сумісність із зворотною стороною, Xe Graphics, Cypress Cove
Нові відомості про Intel Rocket Lake: Сумісність із зворотною стороною, Xe Graphics, Cypress Cove

Intel опублікувала трохи більше інформації про Rocket Lake та його 10-нм процесор, який було перенесено назад на 14 нм.

Intel випускає нові мобільні графічні процесори Xe Max для творців вмісту початкового рівня
Intel випускає нові мобільні графічні процесори Xe Max для творців вмісту початкового рівня

Intel випустила новий споживчий мобільний графічний процесор, але він має дуже конкретний варіант використання, принаймні зараз.

Огляд Ryzen 9 5950X та 5900X: AMD розв’язує Zen 3 проти останніх бастіонів продуктивності Intel
Огляд Ryzen 9 5950X та 5900X: AMD розв’язує Zen 3 проти останніх бастіонів продуктивності Intel

AMD продовжує натиск на те, що колись було безперечним торфом Intel.