Nvidia представила графічний процесор Ampere A100 80 ГБ із пропускною здатністю 2 ТБ / с

Ampere був запущений лише півроку тому, але Nvidia модернізує топову версію свого графічного процесора, щоб запропонувати ще більше VRAM і значно більшу пропускну здатність. A100 (80 ГБ) зберігає більшість специфікацій A100 (40 ГБ): частота посилення 1,41 ГГц, 5120-бітна шина пам'яті, 19,5 TFLOP одноточної точності, підтримка NVLink 3 та 400 Вт TDP не змінюються в порівнянні з попередньою ітерацією графічного процесора. Обидва чіпи також мають 6192 ядра графічного процесора.
Що відрізняється, так це максимальний обсяг VRAM (80 ГБ, в порівнянні з 40 ГБ) і загальна пропускна здатність пам'яті (3,2 Гбіт / с HBMe, а не 2,4 Гбіт / с HBMe). Пропускна здатність у всьому масиві HBM2 становить 2 ТБ / с порівняно з 1,6 ТБ / с. Це потужне оновлення - для Nvidia не було б незвичним зменшити пропускну здатність пам’яті масиву, щоб подвоїти ємність. Натомість компанія збільшила загальну пропускну здатність на 1,25 рази.

A100 має шість стеків HBM2, як ви можете бачити на зображенні вище, але Nvidia вимикає один із стеків, щоб покращити прибутковість. Решта п'ять стеків мають 1024-бітну шину пам'яті, звідки походить цифра 5120-бітної шини. Nvidia замінила HBM2 на 40 ГБ A100 на HBM2E, що дозволило істотно оновити базові характеристики.
Аромат на 80 ГБ повинен приносити користь робочим навантаженням, які обмежені ємністю та пропускною здатністю пам'яті. Як і варіант із 40 ГБ, A100 80 ГБ може підтримувати до 7 екземплярів обладнання з до 10 ГБ VRAM, виділених для кожного.
Nvidia продає ці графічні процесори в антресольних картах, які, як очікується, будуть розміщені як у конфігурації HGX, так і у DGX. Клієнти, які хочуть отримати окремий графічний процесор A100 на картці PCIe, все ще обмежені варіантом 40 ГБ, хоча це може змінитися в майбутньому.
Цінник на сервері, заповненому картками A100 на 80 Гб, буде твердо на території "якщо вам потрібно запитати, ви не можете собі це дозволити". Але є причина, що компанії, що займаються передовим напрямком розвитку ШІ, можуть платити стільки. Складність моделі графічного процесора обмежена вбудованою пам'яттю. Якщо вам доведеться торкнутися основної системної пам'яті, загальна продуктивність буде кратером - процесори можуть мати таку потужність DRAM, яку дослідники ШІ хотіли б для своїх моделей, але вони не можуть забезпечити необхідну пропускну здатність (і процесори не є чудовими для моделювання нейронних у будь-якому випадку). Розширення загального пулу вбудованої VRAM може дозволити розробникам підвищити абсолютну складність моделі, яку вони навчають, або вирішити проблеми, які раніше не могли вміститися в пул VRAM на 40 Гб.
Читати далі

Раджа Кодурі від Intel представить на майбутній конференції Samsung Foundry
Цього тижня Раджа Кодурі від Intel виступить на ливарному заході Samsung - і це не те, що сталося б, якби Intel не мала чого сказати.

Microsoft об'єднується з Samsung, щоб представити трансляцію ігор Xbox
Вам знадобиться 2022 модель Samsung Smart TV або Monitor, що, правда, може бути простіше знайти, ніж новітні консолі Xbox.

Intel, щоб представити Wi-Fi 7 у 2024 році, подвоїть швидкість Wi-Fi 6E
Багато людей ще не використовують Wi-Fi 6E (він же 80211.ax), але Intel вже тестує свого наступника; Wi-Fi 7.

AMD, щоб представити процесорів Ryzen 7000-серій у серпні, продажі розпочнуться 15 вересня
Як повідомляється, компанія запустить чотири процесори Zen 4 у серпні, які надійдуть у продаж у вересні.