Nvidia представила графічний процесор Ampere A100 80 ГБ із пропускною здатністю 2 ТБ / с
Ampere був запущений лише півроку тому, але Nvidia модернізує топову версію свого графічного процесора, щоб запропонувати ще більше VRAM і значно більшу пропускну здатність. A100 (80 ГБ) зберігає більшість специфікацій A100 (40 ГБ): частота посилення 1,41 ГГц, 5120-бітна шина пам'яті, 19,5 TFLOP одноточної точності, підтримка NVLink 3 та 400 Вт TDP не змінюються в порівнянні з попередньою ітерацією графічного процесора. Обидва чіпи також мають 6192 ядра графічного процесора.
Що відрізняється, так це максимальний обсяг VRAM (80 ГБ, в порівнянні з 40 ГБ) і загальна пропускна здатність пам'яті (3,2 Гбіт / с HBMe, а не 2,4 Гбіт / с HBMe). Пропускна здатність у всьому масиві HBM2 становить 2 ТБ / с порівняно з 1,6 ТБ / с. Це потужне оновлення - для Nvidia не було б незвичним зменшити пропускну здатність пам’яті масиву, щоб подвоїти ємність. Натомість компанія збільшила загальну пропускну здатність на 1,25 рази.
A100 має шість стеків HBM2, як ви можете бачити на зображенні вище, але Nvidia вимикає один із стеків, щоб покращити прибутковість. Решта п'ять стеків мають 1024-бітну шину пам'яті, звідки походить цифра 5120-бітної шини. Nvidia замінила HBM2 на 40 ГБ A100 на HBM2E, що дозволило істотно оновити базові характеристики.
Аромат на 80 ГБ повинен приносити користь робочим навантаженням, які обмежені ємністю та пропускною здатністю пам'яті. Як і варіант із 40 ГБ, A100 80 ГБ може підтримувати до 7 екземплярів обладнання з до 10 ГБ VRAM, виділених для кожного.
Nvidia продає ці графічні процесори в антресольних картах, які, як очікується, будуть розміщені як у конфігурації HGX, так і у DGX. Клієнти, які хочуть отримати окремий графічний процесор A100 на картці PCIe, все ще обмежені варіантом 40 ГБ, хоча це може змінитися в майбутньому.
Цінник на сервері, заповненому картками A100 на 80 Гб, буде твердо на території "якщо вам потрібно запитати, ви не можете собі це дозволити". Але є причина, що компанії, що займаються передовим напрямком розвитку ШІ, можуть платити стільки. Складність моделі графічного процесора обмежена вбудованою пам'яттю. Якщо вам доведеться торкнутися основної системної пам'яті, загальна продуктивність буде кратером - процесори можуть мати таку потужність DRAM, яку дослідники ШІ хотіли б для своїх моделей, але вони не можуть забезпечити необхідну пропускну здатність (і процесори не є чудовими для моделювання нейронних у будь-якому випадку). Розширення загального пулу вбудованої VRAM може дозволити розробникам підвищити абсолютну складність моделі, яку вони навчають, або вирішити проблеми, які раніше не могли вміститися в пул VRAM на 40 Гб.
Читати далі
Чому латентність впливає на продуктивність SSD більше, ніж пропускна здатність
Пропускна здатність до SSD Performance, але латентність важливіше. Також, чому SSDS такі хороші оновлення для такого широкого спектру апаратного забезпечення, включаючи машини, які становлять 15-20 років.
Орангутани виявляють здатність використовувати кам'яні інструменти
Орангутани потенційно ближче до кам'яного віку власного, ніж раніше реалізували.
GPU-Z додає фальшиву здатність виявлення GPU для боротьби з підробками
GPU-Z додав нову можливість - утиліта тепер може сканувати, якщо графічний процесор підроблений чи ні, і попередить вас, якщо це є.
JEDEC розширює стандарт HBM2 до 24 Гб, пропускна здатність 307 Гбіт / с на стек
JEDEC оновив стандарт HBM2 для підвищення швидкості передачі та збільшення щільності.