Apple M1 Ultra Crushes Intel в обчислювальній динаміці рідини

Apple M1 Ultra Crushes Intel в обчислювальній динаміці рідини

Дивно важко визначити, як саме M1 порівнюється з процесорами X86 Intel. Незважаючи на те, що сім'я чіпів широко розглянута в ряді загальних споживчих програм, неминучі відмінності між MACOS та Windows, вплив емуляції та різний ступінь оптимізації між X86 та M1 все ускладнює вимірювання.

Цікавий новий результат орієнтиру та супровідний огляд розробника додатків та інженера Крейга Хантера показує, що M1 Ultra абсолютно знищує кожен процесор Intel X86 на полі. Це навіть не справедлива боротьба. Відповідно до результатів Хантера, M1 Ultra, що працює на шість ниток, відповідає продуктивності 28-ядерної робочої станції Xeon з 2019 року.

Apple M1 Ultra Crushes Intel в обчислювальній динаміці рідини

Будь-які затяжні сподіваються, що M1 Ultra зазнає раптового і незрозумілого лиха масштабування вище шести ядер, коли ми розширимо вісь y графіку, достатньо для розміщення даних.

Apple M1 Ultra Crushes Intel в обчислювальній динаміці рідини

Це величезна виграш для М1. Новий процесор Apple більше на 2 рази швидше, ніж найвищий результат Mac Pro 28-яд. Але що ми знаємо про сам тест?

Орієнтир Hunter USM3D, описується NASA як "тетраедральний неструктурований вирішення потоку, який широко використовується в галузі, уряді та наукових колах для вирішення аеродинамічних проблем. З моменту свого першого вступу в 1989 році USM3D стабільно перетворився з індесідного вирішення Ейлера в повний в'язкий код Navier-Stokes ".

Як зазначалося раніше, це тест обчислювальної динаміки рідини, і тести CFD, як відомо, чутливі до пропускної здатності пам'яті. Ми ніколи не тестували USM3D на Wfoojjaec, і це не програма, яку я знайомий, тому ми звернулися до мисливця за деякими додатковими роз'ясненнями на самі тесту і як він складав його для кожної платформи. В Інтернеті було певна спекуляція, що M1 Ultra досяг цих рівнів продуктивності завдяки розширеним розширенням матриці чи іншою, не визначеною оптимізацією, яка не грала для платформи Intel.

За словами Хантера, це неправда.

"Я не посилався на жодних рамок Apple при складанні USM3D на M1 або намагався налаштувати або оптимізувати код для прискорення або AMX", - сказав інженер та розробник додатків. "Я використовував джерело USM3D з Gfortran і зробив досить стандартну компіляцію з оптимізацією -O3".

"Якщо чесно, я думаю, що це ставить виконуваний файл M1 USM3D в незначний недолік до виконуваного файлу Intel USM3D", - продовжив він. "Я використовував компілятор Intel Fortran понад 30 років (це був Dec Fortran, тоді Compaq Fortran, перш ніж стати Intel Fortran), і я знаю, як отримати максимальну користь від цього. Компілятор Intel робить деяку агресивну векторизацію та оптимізацію при складанні USM3D, і історично вона дала кращі показники на X86-64, ніж gfortran. Тож я очікую, що я залишив певну продуктивність на таблиці, використовуючи Gfortran для M1. "

Ми запитали Хантера, що він відчував, пояснив продуктивність M1 Ultra щодо різних систем Intel. Інженер має десятиліття досвіду оцінювання продуктивності CFD на різних платформах, починаючи від настільних систем, таких як Mac Pro та Mac Studio до фактичних суперкомп'ютерів.

«На основі всіх тестувальних минулих та сьогодення я відчуваю, що саме архітектура SOC робить найбільшу різницю тут із машинами Apple Silicon, і коли ми посилаємося на обчислення більшої кількості ядер, пропускна здатність системи стане головним драйвером для масштабування продуктивності. M1 Ultra в студії має шалену кількість системної пропускної здатності ».

Орієнтир базується на коді NASA USM3D CFD, який доступний громадянам США за запитом на програмному забезпеченні.nasa.gov. Він поставляється як вихідний код, і його потрібно буде скласти за допомогою компілятора Fortran (вам також потрібно буде створити OpenMPI з відповідною підтримкою компілятора). MakeFiles налаштовується для MacOS або Linux за допомогою компілятора Intel Fortran, який створює високооптимізований виконуваний файл для X86-64. Ви також можете використовувати GFORTRAN (що я використовував для ARM-64 Apple M1 Systems), але я б очікував, що продуктивність буде нижчою, ніж те, що IFort може ввімкнути x86-64. "

Що ці результати говорять про матч x86 / m1

Це не зовсім дивно, що SOC з більшою пропускною здатністю пам'яті, ніж будь-який попередній процесор, добре працював у середовищі, обмеженому пропускною здатністю. Цікаві в цих результатах, що вони не обов'язково залежать від будь -якої конкретної аспекти ARM проти X86. Дайте AMD або Intel CPU стільки пропускної здатності пам'яті, скільки тут Apple, і продуктивність може покращитися аналогічно.

У моїй статті RISC проти CISC є неправильним об'єктивом для порівняння сучасних процесорів X86, ARM, я провів деякий час, обговорюючи, як Intel виграв Війни Іса десятиліття тому не тому Постійних поліпшень виробництва, при цьому ітеративно вдосконалюючи X86 від покоління до покоління. Тут ми бачимо, що Apple, напевно, робить щось подібне. M1 Ultra не витрачає кожен процесор Intel X86, оскільки це магія, а тому, що інтеграція DRAM On-Package так, як Apple розблокувала величезні покращення продуктивності. Немає причин X86 процесорів також не може скористатися цими прибутками. Той факт, що цей орієнтир настільки пропускна здатність пам'яті обмежена, говорить про те, що системи Lake Top-End Alder можуть відповідати або перевищувати старі ксиони, як 28-ядерний Mac Pro, але він все одно не відповідатиме M1 Ultra для пропускної здатності між SOC та Основна пам’ять.

Насправді ми бачимо, що процесор X86 робить кроки дитини до інтеграції більш швидкісної пам'яті безпосередньо в упаковку, але Intel зберігає цю технологію, зосередженою на серверах, з Sapphire Rapids та її упаковкою HBM2 Memory (доступний на деяких майбутніх SKUS .). Ні Intel, ні AMD не побудували щось на зразок M1 Ultra, однак, принаймні ще не. Поки що AMD зосередився на інтеграції більших кешів L3, а не на рух до DRAM. Будь-який такий крок вимагатиме викупу у виробництві OEM та декількох інших гравців у виробничому просторі ПК.

Я не очікую, що жоден виробник X86 поспішає приймати технологію лише тому, що Apple використовує її, але M1 ставить деякі надзвичайні показники в певних тестах, при відмінних продуктивності за ват. Ви можете поставити під сумнів, що кожен аспект підходу компанії Cupertino до виробництва та дизайну був поставлений під (ймовірно, буквального) мікроскопа в AMD та Intel. Це особливо стосується вигод, які не пов'язані з якоюсь конкретною технологією ISA або виробництва.

Читати далі

У рамках Massive Shift Apple оголошує про нові Mac з чіпом M1 на базі ARM
У рамках Massive Shift Apple оголошує про нові Mac з чіпом M1 на базі ARM

Компанія Apple бачила величезний успіх, коли востаннє перемикала архітектури на Intel, але цього разу? Журі все ще немає, але одне можна сказати точно: Apple збирається заробити набагато більше грошей.

Новий SoC від M1 від Apple виглядає чудово, він не швидший за 98 відсотків ноутбуків для ПК
Новий SoC від M1 від Apple виглядає чудово, він не швидший за 98 відсотків ноутбуків для ПК

Новий кремній M1 від Apple справді виглядає приголомшливо, але це не швидше 98 відсотків проданих ПК минулого року, незважаючи на те, що заявляє компанія.

Що це означає для ринку ПК, якщо Apple робить найшвидший процесор?
Що це означає для ринку ПК, якщо Apple робить найшвидший процесор?

SoC від M1 від Apple може мати глибокий вплив на ринок ПК. Через 25 років x86 може перестати бути найефективнішою архітектурою центрального процесора, яку ви практично можете придбати.

Результати порівняльних показників показують, що Apple M1 перемагає кожен MacBook Pro на базі Intel
Результати порівняльних показників показують, що Apple M1 перемагає кожен MacBook Pro на базі Intel

Новий SoC від M1 від Apple може перемогти кожну окрему систему Intel, яку він продає, принаймні за один ранній результат. Ми копаємось у цифрах та ймовірній конкурентній ситуації.