Intel Details Faster Gen 11 Графическая архитектура

Intel Details Faster Gen 11 Графическая архитектура

Корпорация Intel выпустила новый проектный документ, в котором подробно описываются графические процессоры Gen 11 и их отличие от предыдущего семейства. До этого момента мы получали скромные подробности о новом Uarch на таких мероприятиях, как День архитектуры Intel, но эти новые данные заполняют некоторые ожидаемые технические детали. Предполагается, что графическая архитектура Intel Gen 11 станет основой для ее будущей архитектуры дискретных графических процессоров Xe, поэтому достижения, представленные здесь, являются предварительным обзором, по крайней мере, некоторых функций, которые должны использовать эти карты.

Мы не собираемся делать прогнозы производительности до тех пор, пока не увидим больше от базового оборудования, но, по всей видимости, Intel сможет, по крайней мере, поставить гораздо более эффективную задачу для AMD, чем когда-либо прежде. Исторически сложилось так, что графические процессоры Intel среднего уровня «GT2», установленные на настольных компьютерах и некоторых мобильных чипах, были сравнительно слабыми по сравнению с AMD. Преимущество Intel в этих сравнениях исторически заключалось в силе процессора по сравнению с APU AMD от Bulldozer. Теперь, когда у Ryzen гораздо более эффективное ядро ​​процессора, процессоры AMD Ryzen Mobile намного эффективнее конкурируют с аналогами Intel.

Intel Details Faster Gen 11 Графическая архитектура
Intel Details Faster Gen 11 Графическая архитектура

Новое ядро ​​GPU по номерам. Производительность вычислений примерно в 2,67 раза выше, как и пропускная способность выборки текстур. Пропускная способность ROP удвоилась, равно как и количество тестов с высоким Z на такт. Кэш-память третьего уровня в 4 раза больше, а объем полосы пропускания, доступный для записи графического процессора, удвоился - до 64 байтов за такт. Пропускная способность памяти при использовании DDR4 должна быть одинаковой, но поддержка LPDDR4 допускает теоретически более высокие тактовые частоты ОЗУ в паре с этим типом памяти. Кэш последнего уровня распределяется между GPU и CPU для уменьшения перемещения данных. Блоки видеодекодера были улучшены, чтобы уменьшить битрейт, разрешить многократное одновременное декодирование потоков 4K и 8K, добавить поддержку Adaptive Sync и улучшить декодирование HD-видео.

Intel Details Faster Gen 11 Графическая архитектура

Графический процессор теперь имеет общую локальную память, которая не блокирует доступ к L3 при чтении. Intel утверждает, что это обеспечивает повышение эффективности для локальных и глобальных атомщиков.

Intel Details Faster Gen 11 Графическая архитектура

Вся структура, выше. Корпорация Intel утверждает, что она значительно улучшила общую эффективность использования полосы пропускания памяти с 11-го поколения. Интересно будет посмотреть, насколько это подтвердится, и изменит ли это общие характеристики решений Intel iGPU. Исторически, iGPU AMD были довольно чувствительны к пропускной способности памяти, в то время как чипы Intel были менее подвержены влиянию тактовой частоты ОЗУ. Эти изменения могут сделать часы оперативной памяти более значимыми для Intel.

Грубое пиксельное затенение и потерянная луна POSH

Двумя основными особенностями Gen 11 являются грубое затенение пикселей и POSH, что, очевидно, расшифровывает заливку только по положению, а не некоторую сомнительную ссылку на британскую научно-фантастическую программу.

Грубое затенение пикселей уменьшает нагрузку на графические процессоры, уменьшая количество образцов цвета, используемых для визуализации изображения. Другие детали, такие как геометрия, не масштабируются таким образом, чтобы сохранить детали сцены. Сокращение количества выполнений пиксельного шейдера может сэкономить электроэнергию и повысить производительность. Прибавка в день архитектуры Intel от CPS находилась в диапазоне 20-40 процентов в зависимости от того, насколько активна эта функция. 2 × 2 оказал минимальное влияние на визуальные эффекты и улучшил производительность в умеренной степени, 4 × 4 был гораздо более заметным, но также предлагал больше подъема.

Intel Details Faster Gen 11 Графическая архитектура

Канал POSH, о котором мы говорили выше, является частью системы Intel Position Only Tile-Based Rendering (PTBR), которая использует два геометрических конвейера - стандартный канал рендеринга и конвейер POSH. Intel заявляет, что:

Канал POSH выполняет позиционный шейдер параллельно с основным приложением, но обычно генерирует результаты намного быстрее, поскольку он только затеняет атрибуты позиции и избегает рендеринга пикселей. Канал POSH работает впереди и использует атрибут затененного положения для вычисления информации о видимости для треугольников, чтобы определить, выбраны они или нет. Блок записи видимости объекта трубы POSH рассчитывает видимость, сжимает информацию и записывает ее в память.
Канал POSH выполняет позиционный шейдер параллельно с основным приложением, но обычно генерирует результаты намного быстрее, поскольку он только затеняет атрибуты позиции и избегает рендеринга пикселей. Канал POSH работает впереди и использует атрибут затененного положения для вычисления информации о видимости для треугольников, чтобы определить, выбраны они или нет. Блок записи видимости объекта трубы POSH рассчитывает видимость, сжимает информацию и записывает ее в память.

Канал POSH выполняет позиционный шейдер параллельно с основным приложением, но обычно генерирует результаты намного быстрее, поскольку он только затеняет атрибуты позиции и избегает рендеринга пикселей. Канал POSH работает впереди и использует атрибут затененного положения для вычисления информации о видимости для треугольников, чтобы определить, выбраны они или нет. Блок записи видимости объекта трубы POSH рассчитывает видимость, сжимает информацию и записывает ее в память.

Теоретически, POSH должен быть более быстрым и более энергоэффективным способом обработки определенных типов обработки геометрии. Общая производительность и применимость к рабочим нагрузкам, вероятно, будут зависеть от типа режима рендеринга, используемого играми. Тем не менее, Intel явно думает о том, как увеличить пропускную способность памяти и внедрить в эту идею более продвинутые функции, чем мы видели ранее.

В целом Gen11 станет значительным обновлением для Санта-Клары. Первые два поколения AMD Ryzen Mobile столкнулись с перегретой графикой Skylake. В третьем поколении Ryzen Mobile APU каждый раз, когда он запускается, придется конкурировать с чем-то более громким. Полный документ доступен здесь.

Читать далее

AMD привносит свою архитектуру Zen 3, до восьми ядер процессоров в Chromebooks
AMD привносит свою архитектуру Zen 3, до восьми ядер процессоров в Chromebooks

AMD идет за высококачественным рынком Chromebook со своими новейшими APU Zen 3.

TSMC объявляет «FINFLEX» 3NM архитектуры с переменными конфигурациями
TSMC объявляет «FINFLEX» 3NM архитектуры с переменными конфигурациями

TSMC раскрыла новую смелую новую настраиваемую архитектуру «FinFlex» для своего 3NM процесса.

Intel подтверждает совершенно новую микроархитектуру для лунного озера
Intel подтверждает совершенно новую микроархитектуру для лунного озера

Мы узнаем больше об этой архитектуре с низким энергопотреблением 26-го числа.

Крупнейший SSD в мире утверждает 100-мегабайтную емкость, многопроцессорную архитектуру
Крупнейший SSD в мире утверждает 100-мегабайтную емкость, многопроцессорную архитектуру

Nimbus Data претендует на новый рекорд для крупнейшего SSD, с 100 ТБ памяти в 3,5-дюймовом форм-факторе и новой многопроцессорной архитектурой.