Nvidia представляет графический процессор Ampere A100 80 ГБ с пропускной способностью памяти 2 ТБ / с

Nvidia представляет графический процессор Ampere A100 80 ГБ с пропускной способностью памяти 2 ТБ / с

Ampere был запущен всего шесть месяцев назад, но Nvidia обновляет топовую версию своего графического процессора, чтобы предложить еще больше VRAM и значительно большую пропускную способность. A100 (80 ГБ) сохраняет большинство спецификаций A100 (40 ГБ): тактовая частота в ускоренном режиме 1,41 ГГц, шина памяти 5120 бит, 19,5 терафлопс с одинарной точностью, поддержка NVLink 3 и его TDP 400 Вт не изменились по сравнению с предыдущей версией GPU. Оба чипа также имеют 6192 ядра графического процессора.

Отличается максимальный объем видеопамяти (80 ГБ, вместо 40 ГБ) и общая пропускная способность памяти (HBMe 3,2 Гбит / с вместо HBMe 2,4 Гбит / с). Пропускная способность всего массива HBM2 составляет 2 ТБ / с по сравнению с 1,6 ТБ / с. Это серьезное обновление - для Nvidia не было ничего необычного в уменьшении пропускной способности памяти массива, чтобы удвоить емкость. Вместо этого компания увеличила общую пропускную способность в 1,25 раза.

Nvidia представляет графический процессор Ampere A100 80 ГБ с пропускной способностью памяти 2 ТБ / с

A100 имеет шесть стеков HBM2, как вы можете видеть на изображении выше, но Nvidia отключает один из стеков для повышения урожайности. Остальные пять стеков имеют 1024-битную шину памяти, отсюда и 5120-битная шина. Nvidia заменила HBM2 на A100 40 ГБ на HBM2E, что позволило существенно обновить базовые характеристики.

Вариант 80 ГБ должен быть полезен при рабочих нагрузках с ограничением как емкости, так и полосы пропускания памяти. Как и вариант 40 ГБ, A100 80 ГБ может поддерживать до 7 экземпляров оборудования с выделением до 10 ГБ видеопамяти для каждого.

Nvidia продает эти графические процессоры в виде мезонинных карт, которые, как ожидается, будут развернуты в конфигурации HGX или DGX. Клиенты, которым нужен отдельный графический процессор A100 в карте PCIe, по-прежнему ограничены вариантом 40 ГБ, хотя это может измениться в будущем.

Ценник сервера с картами A100 емкостью 80 ГБ будет строго соответствовать принципу «если нужно спросить, вы не можете себе этого позволить». Но есть причина, по которой компании, ведущие разработку искусственного интеллекта, могут платить так много. Сложность модели GPU ограничивается встроенной памятью. Если вам придется коснуться основной системной памяти, общая производительность упадет - ЦП могут иметь такую ​​емкость DRAM, которую исследователи ИИ хотели бы использовать для своих моделей, но они не могут обеспечить необходимую пропускную способность (а ЦП не подходят для моделирования нейронных сетей сети в любом случае). Расширение общего пула встроенной видеопамяти может позволить разработчикам повысить абсолютную сложность модели, которую они обучают, или решить проблемы, которые ранее не могли уместиться в пуле видеопамяти объемом 40 ГБ.

Читать далее

Почему задержка влияет на производительность SSD больше, чем пропускная способность
Почему задержка влияет на производительность SSD больше, чем пропускная способность

Пропускная способность имеет значение для спектакля SSD, но задержка имеет значение больше. Также почему SSDS являются такими хорошими обновлениями для такого широкого спектра оборудования, в том числе машины, которые на 15-20 лет.

Платежеспособность LG «Bootloop»: 425 долларов США в виде наличных или 700 долларов США
Платежеспособность LG «Bootloop»: 425 долларов США в виде наличных или 700 долларов США

Владельцы LG G4, V10, V20, Nexus 5X и G5 подали иск против компании в прошлом году, и стороны, по-видимому, достигли соглашения.

Полная способность самообслуживания Tesla Yanks «На фоне путаницы владельца
Полная способность самообслуживания Tesla Yanks «На фоне путаницы владельца

На этой неделе в новостях Tesla: самая дешевая модель Теслы 3 будет стоить 45 000 долларов. Это не считается моделью 3 000 долларов США, которую вы еще не можете получить. Кроме того, Teslas, еще не заказанный, может получить налоговый кредит в размере 7500 долларов США.

JEDEC расширяет стандарт HBM2 до 24 ГБ, пропускную способность 307 ГБ / с на стек
JEDEC расширяет стандарт HBM2 до 24 ГБ, пропускную способность 307 ГБ / с на стек

JEDEC обновил стандарт HBM2 для более высоких скоростей передачи и повышенной плотности.