Nvidia представила графічний процесор Ampere A100 80 ГБ із пропускною здатністю 2 ТБ / с

Ampere був запущений лише півроку тому, але Nvidia модернізує топову версію свого графічного процесора, щоб запропонувати ще більше VRAM і значно більшу пропускну здатність. A100 (80 ГБ) зберігає більшість специфікацій A100 (40 ГБ): частота посилення 1,41 ГГц, 5120-бітна шина пам'яті, 19,5 TFLOP одноточної точності, підтримка NVLink 3 та 400 Вт TDP не змінюються в порівнянні з попередньою ітерацією графічного процесора. Обидва чіпи також мають 6192 ядра графічного процесора.

Що відрізняється, так це максимальний обсяг VRAM (80 ГБ, в порівнянні з 40 ГБ) і загальна пропускна здатність пам'яті (3,2 Гбіт / с HBMe, а не 2,4 Гбіт / с HBMe). Пропускна здатність у всьому масиві HBM2 становить 2 ТБ / с порівняно з 1,6 ТБ / с. Це потужне оновлення - для Nvidia не було б незвичним зменшити пропускну здатність пам’яті масиву, щоб подвоїти ємність. Натомість компанія збільшила загальну пропускну здатність на 1,25 рази.

A100 має шість стеків HBM2, як ви можете бачити на зображенні вище, але Nvidia вимикає один із стеків, щоб покращити прибутковість. Решта п'ять стеків мають 1024-бітну шину пам'яті, звідки походить цифра 5120-бітної шини. Nvidia замінила HBM2 на 40 ГБ A100 на HBM2E, що дозволило істотно оновити базові характеристики.

Аромат на 80 ГБ повинен приносити користь робочим навантаженням, які обмежені ємністю та пропускною здатністю пам'яті. Як і варіант із 40 ГБ, A100 80 ГБ може підтримувати до 7 екземплярів обладнання з до 10 ГБ VRAM, виділених для кожного.

Nvidia продає ці графічні процесори в антресольних картах, які, як очікується, будуть розміщені як у конфігурації HGX, так і у DGX. Клієнти, які хочуть отримати окремий графічний процесор A100 на картці PCIe, все ще обмежені варіантом 40 ГБ, хоча це може змінитися в майбутньому.

Цінник на сервері, заповненому картками A100 на 80 Гб, буде твердо на території "якщо вам потрібно запитати, ви не можете собі це дозволити". Але є причина, що компанії, що займаються передовим напрямком розвитку ШІ, можуть платити стільки. Складність моделі графічного процесора обмежена вбудованою пам'яттю. Якщо вам доведеться торкнутися основної системної пам'яті, загальна продуктивність буде кратером - процесори можуть мати таку потужність DRAM, яку дослідники ШІ хотіли б для своїх моделей, але вони не можуть забезпечити необхідну пропускну здатність (і процесори не є чудовими для моделювання нейронних у будь-якому випадку). Розширення загального пулу вбудованої VRAM може дозволити розробникам підвищити абсолютну складність моделі, яку вони навчають, або вирішити проблеми, які раніше не могли вміститися в пул VRAM на 40 Гб.

Читати далі

Порівняння Apple M1, A14 показує відмінності в дизайні SoC

Nvidia представила графічний процесор Ampere A100 80 ГБ із пропускною здатністю 2 ТБ / с

Читати далі

Порівняння Apple M1, A14 показує відмінності в дизайні SoC

Apple представляє новий a15 bionic soc

TSMC очікується виграти ексклюзивні замовлення для Apple 2019 A13 SoC

IPad Pro Apple A12X майже відповідає найпопулярнішим процесорам x86 в GeekBench