Intel детальніше швидше Gen 11 графічної архітектури

Intel детальніше швидше Gen 11 графічної архітектури

Компанія Intel випустила новий проектний документ, який детально описує графічні процесори Gen 11 і як вони відрізнятимуться від попередньої сім'ї. До цього моменту ми отримали скромні подробиці щодо нового uarch, на подіях, таких як День архітектури Intel, але ці нові дані доповнюють деякі очікувані технічні деталі. Очікується, що графічна архітектура Gen 11 компанії Intel стане основою для майбутньої архітектури дискретного графічного процесора Xe, тому досягнуті успіхи тут є попереднім переглядом принаймні деяких функцій, які ці картки повинні розгортати.

Ми не збираємося прогнозувати продуктивність доти, доки ми не побачимо більше від основного обладнання, але, по всій видимості, Intel, принаймні, зможе набагато ефективніший виклик для AMD, ніж коли-небудь раніше. Історично, графічні процесори Intel GT2 в середньому діапазоні, які він встановлює на стільниці, і деякі мобільні чіпи були порівняно слабкими в порівнянні з AMD. Перевагою Intel у цих порівняннях є історична потужність процесора в порівнянні з БПЗ, отриманими від AMD. Тепер, коли Ryzen має набагато більш ефективне ядро ​​процесора, процесори Ryzen Mobile від AMD набагато ефективніше конкурують зі своїми колегами Intel.

Intel детальніше швидше Gen 11 графічної архітектури
Intel детальніше швидше Gen 11 графічної архітектури

Новий ядро ​​GPU за номерами. Продуктивність обчислень приблизно на 2.67x вище, як і пропускна здатність вибірки текстури. Пропускна здатність ROP збільшилася вдвічі, так само, як і кількість високих Z-тестів на годинник. Кеш L3 збільшився в 4 рази, а обсяг пропускної здатності, доступний для записів GPU, збільшився вдвічі - до 64 байт за годину. Пропускна здатність пам'яті при використанні DDR4 повинна бути однаковою, але підтримка LPDDR4 дозволяє теоретично підвищувати частоту пам'яті в парі з цим типом пам'яті. Кеш останнього рівня розподіляється між GPU і CPU для зменшення руху даних. Блоки декодера відео покращено для зменшення бітрейту, дозволяють багаторазове одночасне декодування 4K і 8K потоків, додають підтримку Adaptive Sync і покращують декодування HD-відео.

Intel детальніше швидше Gen 11 графічної архітектури

GPU тепер має спільну локальну пам'ять, яка не блокує доступ L3 під час читання. Intel стверджує, що це забезпечує підвищення ефективності для локальних і глобальних атомів.

Intel детальніше швидше Gen 11 графічної архітектури

Вся структура, вище. Компанія Intel стверджує, що вона значно покращила загальну ефективність пропускної здатності пам'яті за допомогою Gen 11. Це буде цікаво побачити, наскільки вірно це доводить і чи змінює вона загальні характеристики рішень Intel iGPU. Історично, AMG iGPUs були досить чутливі до пропускної здатності пам'яті, тоді як чіпи Intel були менш уражені годинником оперативної пам'яті. Ці зміни могли б зробити так, щоб годинник оперативної пам'яті також був більш цікавим для Intel.

Затінення грубих пікселів та втрачена місяць POSH

Дві основні особливості Gen 11 - це грубе піксельне затінення і POSH, що, очевидно, означає позицію Only Shading, а не якась сумнівна посилання на британську науково-фантастичну програму.

Затінення грубих пікселів зменшує навантаження на графічні процесори, зменшуючи кількість кольорових зразків, які використовуються для візуалізації зображення. Інші деталі, такі як геометрія, не масштабуються таким чином, щоб зберегти деталі сцени. Зменшення кількості виконаних піксельних шейдерів може заощадити енергію та підвищити продуктивність. Піднесення на день архітектури Intel від CPS було у діапазоні 20-40 відсотків залежно від того, наскільки активована функція. 2 × 2 мали мінімальний вплив на візуальні ефекти і поліпшену продуктивність за помірною величиною, 4 × 4 було набагато більш помітним, але також пропонувалося більше підняття.

Intel детальніше швидше Gen 11 графічної архітектури

Труба POSH, про яку ми говорили вище, є частиною системи позиціонування на основі плитки (PTBR) корпорації Intel, яка розгортає дві трубопроводи геометрії - стандартну трубу візуалізації та трубопровід POSH. Intel стверджує, що:

Труба POSH виконує шейдер позиції паралельно з головним додатком, але зазвичай генерує результати набагато швидше, оскільки він лише відтінкує атрибути позиції і уникає візуалізації пікселів. Труба POSH проходить попереду і використовує зафарбований атрибут положення, щоб обчислити інформацію про видимість для трикутників, щоб визначити, чи вони вилучені чи ні. Блок запису видимості об'єкта труби POSH обчислює видимість, стискає інформацію і записує її в пам'ять.
Труба POSH виконує шейдер позиції паралельно з головним додатком, але зазвичай генерує результати набагато швидше, оскільки він лише відтінкує атрибути позиції і уникає візуалізації пікселів. Труба POSH проходить попереду і використовує зафарбований атрибут положення, щоб обчислити інформацію про видимість для трикутників, щоб визначити, чи вони вилучені чи ні. Блок запису видимості об'єкта труби POSH обчислює видимість, стискає інформацію і записує її в пам'ять.

Труба POSH виконує шейдер позиції паралельно з головним додатком, але зазвичай генерує результати набагато швидше, оскільки він лише відтінкує атрибути позиції і уникає візуалізації пікселів. Труба POSH проходить попереду і використовує зафарбований атрибут положення, щоб обчислити інформацію про видимість для трикутників, щоб визначити, чи вони вилучені чи ні. Блок запису видимості об'єкта труби POSH обчислює видимість, стискає інформацію і записує її в пам'ять.

Теоретично, POSH має бути більш швидким, більш енергоефективним способом обробки певних типів обробки геометрії. Загальна продуктивність та застосовність до робочих навантажень, швидше за все, залежатимуть від типу режиму рендерингу, який використовують ігри. Тим не менш, Intel чітко думає про те, як максимально збільшити пропускну здатність пам'яті та запровадити більш просунуті функції, ніж ми бачили раніше.

Загалом, Gen11 формує до значного оновлення для Санта-Клари. Перші два покоління AMD Ryzen Mobile зіткнулися з перегрітою графікою Skylake. Робзен мобільний APU третього покоління, коли він запускає, доведеться змагатися з чимось більшим. Повний документ доступний тут.

Читати далі

Gigabyte витікає AMD ZEN 4 Детальніше: 5NM, AVX-512, 96 CORES, 12-канальний DDR5
Gigabyte витікає AMD ZEN 4 Детальніше: 5NM, AVX-512, 96 CORES, 12-канальний DDR5

Нові деталі просочилися на майбутніх гусячих процесорах AMD на основі порушення серверів Gigabyte минулого тижня.

Детальніший погляд на AMD Radeon RX 7900 XTX: Потужний, але не вистачає проїзних променів
Детальніший погляд на AMD Radeon RX 7900 XTX: Потужний, але не вистачає проїзних променів

Менш дорогі Радеони поставили одну біса боротьби проти RTX 4080, висаджуючись з обох боків у багатьох випробуваннях.

Детальніше виявлено на новій китайській консолі з AMD
Детальніше виявлено на новій китайській консолі з AMD

Нові дані та специфікації з'явилися на ZongShan Subor Z + - китайській ігрової консолі, побудованій на базі процесорів Zen AMD та GPU Vega, але в парі з GDDR5.