Nvidia представила графічний процесор Ampere A100 80 ГБ із пропускною здатністю 2 ТБ / с

Nvidia представила графічний процесор Ampere A100 80 ГБ із пропускною здатністю 2 ТБ / с

Ampere був запущений лише півроку тому, але Nvidia модернізує топову версію свого графічного процесора, щоб запропонувати ще більше VRAM і значно більшу пропускну здатність. A100 (80 ГБ) зберігає більшість специфікацій A100 (40 ГБ): частота посилення 1,41 ГГц, 5120-бітна шина пам'яті, 19,5 TFLOP одноточної точності, підтримка NVLink 3 та 400 Вт TDP не змінюються в порівнянні з попередньою ітерацією графічного процесора. Обидва чіпи також мають 6192 ядра графічного процесора.

Що відрізняється, так це максимальний обсяг VRAM (80 ГБ, в порівнянні з 40 ГБ) і загальна пропускна здатність пам'яті (3,2 Гбіт / с HBMe, а не 2,4 Гбіт / с HBMe). Пропускна здатність у всьому масиві HBM2 становить 2 ТБ / с порівняно з 1,6 ТБ / с. Це потужне оновлення - для Nvidia не було б незвичним зменшити пропускну здатність пам’яті масиву, щоб подвоїти ємність. Натомість компанія збільшила загальну пропускну здатність на 1,25 рази.

Nvidia представила графічний процесор Ampere A100 80 ГБ із пропускною здатністю 2 ТБ / с

A100 має шість стеків HBM2, як ви можете бачити на зображенні вище, але Nvidia вимикає один із стеків, щоб покращити прибутковість. Решта п'ять стеків мають 1024-бітну шину пам'яті, звідки походить цифра 5120-бітної шини. Nvidia замінила HBM2 на 40 ГБ A100 на HBM2E, що дозволило істотно оновити базові характеристики.

Аромат на 80 ГБ повинен приносити користь робочим навантаженням, які обмежені ємністю та пропускною здатністю пам'яті. Як і варіант із 40 ГБ, A100 80 ГБ може підтримувати до 7 екземплярів обладнання з до 10 ГБ VRAM, виділених для кожного.

Nvidia продає ці графічні процесори в антресольних картах, які, як очікується, будуть розміщені як у конфігурації HGX, так і у DGX. Клієнти, які хочуть отримати окремий графічний процесор A100 на картці PCIe, все ще обмежені варіантом 40 ГБ, хоча це може змінитися в майбутньому.

Цінник на сервері, заповненому картками A100 на 80 Гб, буде твердо на території "якщо вам потрібно запитати, ви не можете собі це дозволити". Але є причина, що компанії, що займаються передовим напрямком розвитку ШІ, можуть платити стільки. Складність моделі графічного процесора обмежена вбудованою пам'яттю. Якщо вам доведеться торкнутися основної системної пам'яті, загальна продуктивність буде кратером - процесори можуть мати таку потужність DRAM, яку дослідники ШІ хотіли б для своїх моделей, але вони не можуть забезпечити необхідну пропускну здатність (і процесори не є чудовими для моделювання нейронних у будь-якому випадку). Розширення загального пулу вбудованої VRAM може дозволити розробникам підвищити абсолютну складність моделі, яку вони навчають, або вирішити проблеми, які раніше не могли вміститися в пул VRAM на 40 Гб.

Читати далі

Порівняння Apple M1, A14 показує відмінності в дизайні SoC
Порівняння Apple M1, A14 показує відмінності в дизайні SoC

Новий аналіз M1 розбиває дизайн матриці порівняно зі смартфоном класу A14 SoC.

Apple представляє новий a15 bionic soc
Apple представляє новий a15 bionic soc

Apple оголосила A15 на події iPhone 13, але він не порівнював чіп проти звичайних підозрюваних.

TSMC очікується виграти ексклюзивні замовлення для Apple 2019 A13 SoC
TSMC очікується виграти ексклюзивні замовлення для Apple 2019 A13 SoC

TSMC, як повідомляється, заблокував ексклюзивний для Apple наступний A13 на своєму другому поколінні 7-мегапіксельний вузол.

IPad Pro Apple A12X майже відповідає найпопулярнішим процесорам x86 в GeekBench
IPad Pro Apple A12X майже відповідає найпопулярнішим процесорам x86 в GeekBench

Новий Apple A12X Bionic майже відповідає Intel Core процесорам у сучасних MacBook Pros - але ситуація трохи складніше, ніж може здатися.