New M1 Ultra Packs Apple Revolutory GPU

New M1 Ultra Packs Apple Revolutory GPU

Новий M1 Apple, який виголосив учора, як видається, є справжнім проривом. Нова M1 Ultra виготовляється з двох мікросхем M1 MAX та має новий підхід інтеграції GPU, який раніше не бачив на ринку. Хоча SOC містить два GPUS - один за M1 Max - ігри та програми, що працюють на Apple M1 Ultra див. Один GPU.

New M1 Ultra Packs Apple Revolutory GPU

Під час свого розпису Apple визнав, що M1 Max SOC має особливість, яку компанія не розкриває в минулому році. З самого початку M1 MAX призначений для підтримки високошвидкісного з'єднання через інтерпозер кремнію. Згідно з Apple, ця міжболожна мережа, названа ультрафункція, може забезпечити 2,5-дюйм / с з низькою затримкою пропускної здатності. Компанія стверджує, що це "більше, ніж 4x пропускну здатність провідних багатопрофільних технологій взаємозв'язку".

New M1 Ultra Packs Apple Revolutory GPU

Apple, здається, не посилається на взаємозв'язок ЦПУ тут. CPUS EPYC AMD використовує тканину нескінченності, яка підтримує максимум 204,8 Гб / с пропускної здатності по всій чіпі, коли пари з DDR4-3200. Skylake Xeons Intel використовують Ultra Path Interconnect (UPI), з 141,6 Гбіт / с з'єднання між двома розетками. Жодна з них не близька до 625 Гб / с. Apple може посилатися на GA100 NVIDIA, яка може запропонувати ~ 600 Гбіт / с пропускної здатності через NVLink 3.0. Якщо ми припустимо, NVLink 3.0 - це відповідне порівняння, Apple вимагає, що його новий робочий стіл SOC пропонує 4x між чіпсовою пропускною здатністю GPU NVIDIA's Top-End Server.

New M1 Ultra Packs Apple Revolutory GPU

За даними Apple, забезпечуючи таку масштабну кількість пропускної здатності, дозволяє M1 вести себе і бути визнаним у програмному забезпеченні як єдиний чіп з уніфікованим 128 Гб-басейном пам'яті, він поділяє з процесором. Компанія стверджує, що ніколи не була подібною. Вони можуть бути правильними. Ми знаємо, що NVIDIA та AMD обидва зробили деяку роботу над концепцією поганого GPU, але жодна компанія ніколи не принесла продукт на ринок.

Довга дорога до клубів ГПУ

Концепція розщеплення GPU в дискретні блоки та агрегація їх разом на-пакеті преперечать загальне використання слова "chiplet", навіть якщо це те, що ми сьогодні називаємо цей підхід. NVIDIA виконував дослідження з цього питання кілька років тому.

New M1 Ultra Packs Apple Revolutory GPU

GPUS є деякими з найбільших чіпів, виготовлених за будь-якою заданою ітерацією технологічного вузла. Ті самі економії масштабу, що робить CPU Cliplets доступними та ефективними, може теоретично вигоду GPUS так само. Проблема з Chiplets GPU полягає в тому, що масштабовані робочі навантаження на декількох картах, як правило, вимагає великої кількості тканинних смуг між чіпсами. Чим більше киплети, які ви хочете поєднати, тим важче провозити всі вони разом без впливу на стійку продуктивність.

Обмеження пропускання пам'яті та обмеження латентності є частиною того, чому AMD, Intel та NVIDIA ніколи не відвантажили подвійне графічне рішення, яке може легко скористатися інтегрованим ГПУ, побудованим у багато процесорів сьогодні. Apple, мабуть, знайшла шлях навколо цієї проблеми, де виробники ПК не мають. Причиною цього може бути пояснена більш адресним ринком компанії, ніж недоліки дизайну в Intel або AMD.

Apple має унікальні дизайнерські стимули

І Intel, так і AMD виробляють чіпси для інших людей, щоб побудувати речі. Apple будує компоненти тільки для себе. Intel та AMD підтримують та сприяють виробництві екосистем для настільних комп'ютерів та ноутбуків, а його клієнти цінують гнучкість.

Companies like Dell, HP, and Lenovo want to be able to combine CPUs and GPUs in various ways to hit price points and appeal to customers. Однак від перспективи Apple, клієнти грошових коштів, вилучених до третьої сторони GPU, представляє дохід, який він міг заробляти за себе. Незважаючи на те, що обидва Apple, так і PC OEM отримують додаткові прибутки, коли вони продають систему дискретним ГПУ, поділяючи ці прибуток з AMD, NVIDIA та Intel - це ціна OEMS платить за те, що вони не робили GPU R & D.

New M1 Ultra Packs Apple Revolutory GPU

Клієнт ПК, який створює 16-основний робочий стіл, практично, безумовно, очікує можливості оновити GPU з часом. Деякі клієнти High Core Count не дбають про продуктивність GPU, але для тих, хто робить, можливість оновлення системи з часом є основною особливістю. Apple, навпаки, має довгу скорочення системи модернізації.

Найближчі чіпси X86 до M1 Ultra буде SOCS всередині серії Xbox x та PlayStation 5. Хоча ні консольні функції ON-пакетна пам'ять, вони обидва пропонують потужний GPU, інтегрований безпосередньо на упаковці в системах, призначених для продажу за 500 доларів. Однією з причин ми не бачимо таких чіпів на ринку ПК, тому що OEM-вартісна гнучкість і модульність більше, ніж цінують здатність стандартизувати на жменю чіпів протягом багатьох років.

Може бути, що однією з причин ми не бачили такого роду чіп від AMD, Intel, або NVIDIA є тому, що ніхто з них не мав особливого стимулу будувати його.

Як MAX Apple Max використовує пропускну здатність пам'яті

Коли MAX MAX Apple, тести показали, що CPU Corred не можуть отримати доступ до повної смуги пропускної здатності системи. З 400 Гбіт / с теоретичної пропускної здатності, доступної для M1 MAX, CPU може використовувати лише ~ 250 Гб / с.

New M1 Ultra Packs Apple Revolutory GPU

Решта пропускної здатності виділяється на інші блоки Соц. ANANDTECH виміряв ГПУ як потягнувши ~ 90 Гб / с пропускної здатності та решту тканини при 40-50 Гбіт / с під час важкого використання.

З огляду на ці видів специфікації, слюснувши два чіпи поруч-бік, з дубльованими басейнами RAM, автоматично не звучить як величезне досягнення. AMD судна вісім киплетів, встановлених на загальному інтерпозер у 64-ядерному ППУ EPYC. Але саме де масштабування Apple мають вагу.

Для того, щоб M1 Ultra GPU працював уніфікованим рішенням, це означає, як дані GPUS поділяють, так і адреси пам'яті на двох фізичних штампів. У звичайному багатопрофільному розчині, пара картки з 16 ГБ VRAM кожен буде з'являтися як картки 2x16GB, а не однієї картки з 32 Гб VRAM. NVIDIA NVLink дозволяє два або більше GPUS басейн VRAM, але ступінь вдосконалення продуктивності значно відрізняється залежно від робочого навантаження.

New M1 Ultra Packs Apple Revolutory GPU

Що стосується того, що таке клієнти з продуктивності GPU повинні очікувати? Це незрозуміло. M1 Max працює добре у робочих навантаженнях відео обробки, але є посередним ігровим графічним процесором. M1 Ultra має бачити сильне масштабування завдяки подвоюючим ресурсам GPU, але відсутність підтримки Apple для Mac Gaming може підривати будь-яку перевагу продуктивності, апаратне забезпечення може доставити.

Великий прорив Apple тут знаходиться у створенні GPU в двох відмінних скибочках, які, мабуть, поводиться як одна логічна карта. AMD та NVIDIA продовжували працювати над графічними киплетами протягом багатьох років, маючи на увазі, ми побачимо дискретних рішень Chiplet з обох компаній у майбутньому. Ми будемо мати більше сказати про показники діяльності Apple, коли ми побачимо, які еталони показують нам про масштабування.