Nvidia представила графічний процесор Ampere A100 80 ГБ із пропускною здатністю 2 ТБ / с

Ampere був запущений лише півроку тому, але Nvidia модернізує топову версію свого графічного процесора, щоб запропонувати ще більше VRAM і значно більшу пропускну здатність. A100 (80 ГБ) зберігає більшість специфікацій A100 (40 ГБ): частота посилення 1,41 ГГц, 5120-бітна шина пам'яті, 19,5 TFLOP одноточної точності, підтримка NVLink 3 та 400 Вт TDP не змінюються в порівнянні з попередньою ітерацією графічного процесора. Обидва чіпи також мають 6192 ядра графічного процесора.
Що відрізняється, так це максимальний обсяг VRAM (80 ГБ, в порівнянні з 40 ГБ) і загальна пропускна здатність пам'яті (3,2 Гбіт / с HBMe, а не 2,4 Гбіт / с HBMe). Пропускна здатність у всьому масиві HBM2 становить 2 ТБ / с порівняно з 1,6 ТБ / с. Це потужне оновлення - для Nvidia не було б незвичним зменшити пропускну здатність пам’яті масиву, щоб подвоїти ємність. Натомість компанія збільшила загальну пропускну здатність на 1,25 рази.

A100 має шість стеків HBM2, як ви можете бачити на зображенні вище, але Nvidia вимикає один із стеків, щоб покращити прибутковість. Решта п'ять стеків мають 1024-бітну шину пам'яті, звідки походить цифра 5120-бітної шини. Nvidia замінила HBM2 на 40 ГБ A100 на HBM2E, що дозволило істотно оновити базові характеристики.
Аромат на 80 ГБ повинен приносити користь робочим навантаженням, які обмежені ємністю та пропускною здатністю пам'яті. Як і варіант із 40 ГБ, A100 80 ГБ може підтримувати до 7 екземплярів обладнання з до 10 ГБ VRAM, виділених для кожного.
Nvidia продає ці графічні процесори в антресольних картах, які, як очікується, будуть розміщені як у конфігурації HGX, так і у DGX. Клієнти, які хочуть отримати окремий графічний процесор A100 на картці PCIe, все ще обмежені варіантом 40 ГБ, хоча це може змінитися в майбутньому.
Цінник на сервері, заповненому картками A100 на 80 Гб, буде твердо на території "якщо вам потрібно запитати, ви не можете собі це дозволити". Але є причина, що компанії, що займаються передовим напрямком розвитку ШІ, можуть платити стільки. Складність моделі графічного процесора обмежена вбудованою пам'яттю. Якщо вам доведеться торкнутися основної системної пам'яті, загальна продуктивність буде кратером - процесори можуть мати таку потужність DRAM, яку дослідники ШІ хотіли б для своїх моделей, але вони не можуть забезпечити необхідну пропускну здатність (і процесори не є чудовими для моделювання нейронних у будь-якому випадку). Розширення загального пулу вбудованої VRAM може дозволити розробникам підвищити абсолютну складність моделі, яку вони навчають, або вирішити проблеми, які раніше не могли вміститися в пул VRAM на 40 Гб.
Читати далі

RISC-V навшпиньки до основного потоку завдяки платформі розробників SiFive, високопродуктивний процесор
RISC V продовжує проникати на ринок, цього разу завдяки дешевшій та повнофункціональнішій тестовій материнській платі.

VIA Technologies, Zhaoxin зміцнюють зв'язки з процесором x86
VIA та Zhaoxin поглиблюють своє стратегічне партнерство за допомогою додаткових передач ІР, спрямованих на пришвидшення довгострокової розробки продуктів.

Intel випускає нові мобільні графічні процесори Xe Max для творців вмісту початкового рівня
Intel випустила новий споживчий мобільний графічний процесор, але він має дуже конкретний варіант використання, принаймні зараз.

Що це означає для ринку ПК, якщо Apple робить найшвидший процесор?
SoC від M1 від Apple може мати глибокий вплив на ринок ПК. Через 25 років x86 може перестати бути найефективнішою архітектурою центрального процесора, яку ви практично можете придбати.