Apple M1 Ultra Crushes Intel в обчислювальній динаміці рідини

Apple M1 Ultra Crushes Intel в обчислювальній динаміці рідини

Дивно важко визначити, як саме M1 порівнюється з процесорами X86 Intel. Незважаючи на те, що сім'я чіпів широко розглянута в ряді загальних споживчих програм, неминучі відмінності між MACOS та Windows, вплив емуляції та різний ступінь оптимізації між X86 та M1 все ускладнює вимірювання.

Цікавий новий результат орієнтиру та супровідний огляд розробника додатків та інженера Крейга Хантера показує, що M1 Ultra абсолютно знищує кожен процесор Intel X86 на полі. Це навіть не справедлива боротьба. Відповідно до результатів Хантера, M1 Ultra, що працює на шість ниток, відповідає продуктивності 28-ядерної робочої станції Xeon з 2019 року.

Apple M1 Ultra Crushes Intel в обчислювальній динаміці рідини

Будь-які затяжні сподіваються, що M1 Ultra зазнає раптового і незрозумілого лиха масштабування вище шести ядер, коли ми розширимо вісь y графіку, достатньо для розміщення даних.

Apple M1 Ultra Crushes Intel в обчислювальній динаміці рідини

Це величезна виграш для М1. Новий процесор Apple більше на 2 рази швидше, ніж найвищий результат Mac Pro 28-яд. Але що ми знаємо про сам тест?

Орієнтир Hunter USM3D, описується NASA як "тетраедральний неструктурований вирішення потоку, який широко використовується в галузі, уряді та наукових колах для вирішення аеродинамічних проблем. З моменту свого першого вступу в 1989 році USM3D стабільно перетворився з індесідного вирішення Ейлера в повний в'язкий код Navier-Stokes ".

Як зазначалося раніше, це тест обчислювальної динаміки рідини, і тести CFD, як відомо, чутливі до пропускної здатності пам'яті. Ми ніколи не тестували USM3D на Wfoojjaec, і це не програма, яку я знайомий, тому ми звернулися до мисливця за деякими додатковими роз'ясненнями на самі тесту і як він складав його для кожної платформи. В Інтернеті було певна спекуляція, що M1 Ultra досяг цих рівнів продуктивності завдяки розширеним розширенням матриці чи іншою, не визначеною оптимізацією, яка не грала для платформи Intel.

За словами Хантера, це неправда.

"Я не посилався на жодних рамок Apple при складанні USM3D на M1 або намагався налаштувати або оптимізувати код для прискорення або AMX", - сказав інженер та розробник додатків. "Я використовував джерело USM3D з Gfortran і зробив досить стандартну компіляцію з оптимізацією -O3".

"Якщо чесно, я думаю, що це ставить виконуваний файл M1 USM3D в незначний недолік до виконуваного файлу Intel USM3D", - продовжив він. "Я використовував компілятор Intel Fortran понад 30 років (це був Dec Fortran, тоді Compaq Fortran, перш ніж стати Intel Fortran), і я знаю, як отримати максимальну користь від цього. Компілятор Intel робить деяку агресивну векторизацію та оптимізацію при складанні USM3D, і історично вона дала кращі показники на X86-64, ніж gfortran. Тож я очікую, що я залишив певну продуктивність на таблиці, використовуючи Gfortran для M1. "

Ми запитали Хантера, що він відчував, пояснив продуктивність M1 Ultra щодо різних систем Intel. Інженер має десятиліття досвіду оцінювання продуктивності CFD на різних платформах, починаючи від настільних систем, таких як Mac Pro та Mac Studio до фактичних суперкомп'ютерів.

«На основі всіх тестувальних минулих та сьогодення я відчуваю, що саме архітектура SOC робить найбільшу різницю тут із машинами Apple Silicon, і коли ми посилаємося на обчислення більшої кількості ядер, пропускна здатність системи стане головним драйвером для масштабування продуктивності. M1 Ultra в студії має шалену кількість системної пропускної здатності ».

Орієнтир базується на коді NASA USM3D CFD, який доступний громадянам США за запитом на програмному забезпеченні.nasa.gov. Він поставляється як вихідний код, і його потрібно буде скласти за допомогою компілятора Fortran (вам також потрібно буде створити OpenMPI з відповідною підтримкою компілятора). MakeFiles налаштовується для MacOS або Linux за допомогою компілятора Intel Fortran, який створює високооптимізований виконуваний файл для X86-64. Ви також можете використовувати GFORTRAN (що я використовував для ARM-64 Apple M1 Systems), але я б очікував, що продуктивність буде нижчою, ніж те, що IFort може ввімкнути x86-64. "

Що ці результати говорять про матч x86 / m1

Це не зовсім дивно, що SOC з більшою пропускною здатністю пам'яті, ніж будь-який попередній процесор, добре працював у середовищі, обмеженому пропускною здатністю. Цікаві в цих результатах, що вони не обов'язково залежать від будь -якої конкретної аспекти ARM проти X86. Дайте AMD або Intel CPU стільки пропускної здатності пам'яті, скільки тут Apple, і продуктивність може покращитися аналогічно.

У моїй статті RISC проти CISC є неправильним об'єктивом для порівняння сучасних процесорів X86, ARM, я провів деякий час, обговорюючи, як Intel виграв Війни Іса десятиліття тому не тому Постійних поліпшень виробництва, при цьому ітеративно вдосконалюючи X86 від покоління до покоління. Тут ми бачимо, що Apple, напевно, робить щось подібне. M1 Ultra не витрачає кожен процесор Intel X86, оскільки це магія, а тому, що інтеграція DRAM On-Package так, як Apple розблокувала величезні покращення продуктивності. Немає причин X86 процесорів також не може скористатися цими прибутками. Той факт, що цей орієнтир настільки пропускна здатність пам'яті обмежена, говорить про те, що системи Lake Top-End Alder можуть відповідати або перевищувати старі ксиони, як 28-ядерний Mac Pro, але він все одно не відповідатиме M1 Ultra для пропускної здатності між SOC та Основна пам’ять.

Насправді ми бачимо, що процесор X86 робить кроки дитини до інтеграції більш швидкісної пам'яті безпосередньо в упаковку, але Intel зберігає цю технологію, зосередженою на серверах, з Sapphire Rapids та її упаковкою HBM2 Memory (доступний на деяких майбутніх SKUS .). Ні Intel, ні AMD не побудували щось на зразок M1 Ultra, однак, принаймні ще не. Поки що AMD зосередився на інтеграції більших кешів L3, а не на рух до DRAM. Будь-який такий крок вимагатиме викупу у виробництві OEM та декількох інших гравців у виробничому просторі ПК.

Я не очікую, що жоден виробник X86 поспішає приймати технологію лише тому, що Apple використовує її, але M1 ставить деякі надзвичайні показники в певних тестах, при відмінних продуктивності за ват. Ви можете поставити під сумнів, що кожен аспект підходу компанії Cupertino до виробництва та дизайну був поставлений під (ймовірно, буквального) мікроскопа в AMD та Intel. Це особливо стосується вигод, які не пов'язані з якоюсь конкретною технологією ISA або виробництва.

Читати далі

Раджа Кодурі від Intel представить на майбутній конференції Samsung Foundry
Раджа Кодурі від Intel представить на майбутній конференції Samsung Foundry

Цього тижня Раджа Кодурі від Intel виступить на ливарному заході Samsung - і це не те, що сталося б, якби Intel не мала чого сказати.

Нові відомості про Intel Rocket Lake: Сумісність із зворотною стороною, Xe Graphics, Cypress Cove
Нові відомості про Intel Rocket Lake: Сумісність із зворотною стороною, Xe Graphics, Cypress Cove

Intel опублікувала трохи більше інформації про Rocket Lake та його 10-нм процесор, який було перенесено назад на 14 нм.

Intel випускає нові мобільні графічні процесори Xe Max для творців вмісту початкового рівня
Intel випускає нові мобільні графічні процесори Xe Max для творців вмісту початкового рівня

Intel випустила новий споживчий мобільний графічний процесор, але він має дуже конкретний варіант використання, принаймні зараз.

Огляд Ryzen 9 5950X та 5900X: AMD розв’язує Zen 3 проти останніх бастіонів продуктивності Intel
Огляд Ryzen 9 5950X та 5900X: AMD розв’язує Zen 3 проти останніх бастіонів продуктивності Intel

AMD продовжує натиск на те, що колись було безперечним торфом Intel.