Утечки раскрывают серии NVIDIA 40 с массивным кешем L2, почти удвоили куда CUDA

Утечки раскрывают серии NVIDIA 40 с массивным кешем L2, почти удвоили куда CUDA

Консорциум пользователей Twitter прорисовались над недавно утечщимися данными из HACK NVIDIA The Rogue Group Lapsus $ и публикуя свои выводы в Интернете. До сих пор утечки подтверждают предыдущие слухи о том, что предложение NVIDIA на следующем препарате действительно поднимает бар. Не только будет предстоящее поле ADA Lovelace GPU NVIDIA гораздо большего кэша L2, флагманский чип также по сообщениям предлагает почти удвоить количество CUDA CORES, найденных в текущем чипе, GA102.

Наибольшее изменение для NVIDIA представляет собой ошеломляющее увеличение 16x в общем сложном кэше L2 на AD102 по сравнению с существующими ампер-графическим процессором, от 6 МБ до 96 МБ в соответствии с резюме через оборудование Тома. Чип AD102 предположительно поставляется с 16 МБ кэша на 64-битный контроллер памяти, а с ожидаемым 384-битным контроллером памяти, который равен 96 МБ кэша. Текущий укол Ampere Ga102 имеет всего 512 кэш-память на 32-битный контроллер памяти, поэтому он является существенным увеличением, а также один, по-видимому, предназначен для соперника раствора Infinity Cache AMD от его графического процессора RDNA2 RX 6800. Интересно, что используют больше кэш, в отличие от большего количества контроллеров памяти, является одним из способов сдерживать энергопотребление, которое является ироническим, поскольку Die AD102 ранее случилось, чтобы потреблять до 85 тыс. Мощности.

Это могло - указать, что кэш Nvidia L2 потребляет значительно больше энергии, чем AMD L3. Это не обязательно удивительно; L1 потребляет больше мощности на KB, чем L2, а L2 потребляет больше, чем L3. Альтернативно, он может указывать на то, что NVIDIA зависит от агрессивных часов или что новый GPU направлен на очень высокое энергопотребление для обеспечения максимальной производительности.

Утечки раскрывают серии NVIDIA 40 с массивным кешем L2, почти удвоили куда CUDA

Такое увеличение пропускной способности памяти необходимо из-за связанного увеличения CUDA CORES, по словам Twitter пользователем FTIWVOOE через VideoCardz. Также сообщается, что AD102 будет спортивным сопоставлением 18 432 ядер, на 71 процентное повышение от 10 752 GA102 на предстоящем RTX 3090 Ti. Нынешняя пропускная способность памяти Ampere 936GB / S будет просто недостаточной для того, чтобы сохранить, что многие ядер Fed, поэтому добавление множества дополнительного кэша, скорее всего, является лучшим решением, добавляющим большее решение контроллеров памяти. Все умирает «Lovelace», также получит гораздо больше кеша, с небольшим количеством фишек AD103 и AD104, упаковка 64 МБ и AD106 с 48 МБ. Ребенок группы, AD107, получит всего 32 МБ, что еще 6x сумма в текущем флагмане GA102.

В качестве оборудования Тома это похоже на очень четкий случай Nvidia Crbibing от подхода AMD с его графическим процессором RDNA2, поскольку он выбирает просто добавить больше кеша вместо более широкой шины памяти. Слухи указывают на NVIDIA не имеют указания в изменении ширины любых конфигураций для следующего поколения, в отличие от того, что весь путь с 512-битным или даже 1024-битной шиной памяти. Там может быть хорошая историческая причина для этого. В прошлом как AMD, так и NVIDIA изредка выставляют графические процессоры с очень широкими автобусами памяти, но такие карты имеют тенденцию предлагать относительно низкую эффективность. Возможно, вместо этого он имеет смысл использовать большие кэши.

Как он стоит, GPU RX 6800 GPU по-прежнему еще больше кеша, чем по слухам GPU серии RTX 40 с 128 МБ кэша Infinity для обеих процессоров в стеке продукта. Тем не менее, также возможно, что AMD может быть увлечен пристройку, что для его графического процессора RDNA3, которые по слухам приходят во второй половине 2022 года вместе с новыми открытками NVIDIA в сентябре.

Читать далее

L2 и L3 кеш: в чем разница?
L2 и L3 кеш: в чем разница?

В чем разница между L3 и другими типами кеша и как это влияет на производительность системы?

Как работают кеши процессоров L1 и L2 и почему они являются неотъемлемой частью современных чипов
Как работают кеши процессоров L1 и L2 и почему они являются неотъемлемой частью современных чипов

Когда-либо было любопытно, как работают кеши L1 и L2? Мы рады, что вы спросили. Здесь мы глубоко погружаемся в структуру и характер одного из самых фундаментальных проектов и инноваций в вычислительной технике.