Intel детальніше швидше Gen 11 графічної архітектури

Компанія Intel випустила новий проектний документ, який детально описує графічні процесори Gen 11 і як вони відрізнятимуться від попередньої сім'ї. До цього моменту ми отримали скромні подробиці щодо нового uarch, на подіях, таких як День архітектури Intel, але ці нові дані доповнюють деякі очікувані технічні деталі. Очікується, що графічна архітектура Gen 11 компанії Intel стане основою для майбутньої архітектури дискретного графічного процесора Xe, тому досягнуті успіхи тут є попереднім переглядом принаймні деяких функцій, які ці картки повинні розгортати.
Ми не збираємося прогнозувати продуктивність доти, доки ми не побачимо більше від основного обладнання, але, по всій видимості, Intel, принаймні, зможе набагато ефективніший виклик для AMD, ніж коли-небудь раніше. Історично, графічні процесори Intel GT2 в середньому діапазоні, які він встановлює на стільниці, і деякі мобільні чіпи були порівняно слабкими в порівнянні з AMD. Перевагою Intel у цих порівняннях є історична потужність процесора в порівнянні з БПЗ, отриманими від AMD. Тепер, коли Ryzen має набагато більш ефективне ядро процесора, процесори Ryzen Mobile від AMD набагато ефективніше конкурують зі своїми колегами Intel.


Новий ядро GPU за номерами. Продуктивність обчислень приблизно на 2.67x вище, як і пропускна здатність вибірки текстури. Пропускна здатність ROP збільшилася вдвічі, так само, як і кількість високих Z-тестів на годинник. Кеш L3 збільшився в 4 рази, а обсяг пропускної здатності, доступний для записів GPU, збільшився вдвічі - до 64 байт за годину. Пропускна здатність пам'яті при використанні DDR4 повинна бути однаковою, але підтримка LPDDR4 дозволяє теоретично підвищувати частоту пам'яті в парі з цим типом пам'яті. Кеш останнього рівня розподіляється між GPU і CPU для зменшення руху даних. Блоки декодера відео покращено для зменшення бітрейту, дозволяють багаторазове одночасне декодування 4K і 8K потоків, додають підтримку Adaptive Sync і покращують декодування HD-відео.

GPU тепер має спільну локальну пам'ять, яка не блокує доступ L3 під час читання. Intel стверджує, що це забезпечує підвищення ефективності для локальних і глобальних атомів.

Вся структура, вище. Компанія Intel стверджує, що вона значно покращила загальну ефективність пропускної здатності пам'яті за допомогою Gen 11. Це буде цікаво побачити, наскільки вірно це доводить і чи змінює вона загальні характеристики рішень Intel iGPU. Історично, AMG iGPUs були досить чутливі до пропускної здатності пам'яті, тоді як чіпи Intel були менш уражені годинником оперативної пам'яті. Ці зміни могли б зробити так, щоб годинник оперативної пам'яті також був більш цікавим для Intel.
Затінення грубих пікселів та втрачена місяць POSH
Дві основні особливості Gen 11 - це грубе піксельне затінення і POSH, що, очевидно, означає позицію Only Shading, а не якась сумнівна посилання на британську науково-фантастичну програму.
Затінення грубих пікселів зменшує навантаження на графічні процесори, зменшуючи кількість кольорових зразків, які використовуються для візуалізації зображення. Інші деталі, такі як геометрія, не масштабуються таким чином, щоб зберегти деталі сцени. Зменшення кількості виконаних піксельних шейдерів може заощадити енергію та підвищити продуктивність. Піднесення на день архітектури Intel від CPS було у діапазоні 20-40 відсотків залежно від того, наскільки активована функція. 2 × 2 мали мінімальний вплив на візуальні ефекти і поліпшену продуктивність за помірною величиною, 4 × 4 було набагато більш помітним, але також пропонувалося більше підняття.

Труба POSH, про яку ми говорили вище, є частиною системи позиціонування на основі плитки (PTBR) корпорації Intel, яка розгортає дві трубопроводи геометрії - стандартну трубу візуалізації та трубопровід POSH. Intel стверджує, що:

Труба POSH виконує шейдер позиції паралельно з головним додатком, але зазвичай генерує результати набагато швидше, оскільки він лише відтінкує атрибути позиції і уникає візуалізації пікселів. Труба POSH проходить попереду і використовує зафарбований атрибут положення, щоб обчислити інформацію про видимість для трикутників, щоб визначити, чи вони вилучені чи ні. Блок запису видимості об'єкта труби POSH обчислює видимість, стискає інформацію і записує її в пам'ять.
Теоретично, POSH має бути більш швидким, більш енергоефективним способом обробки певних типів обробки геометрії. Загальна продуктивність та застосовність до робочих навантажень, швидше за все, залежатимуть від типу режиму рендерингу, який використовують ігри. Тим не менш, Intel чітко думає про те, як максимально збільшити пропускну здатність пам'яті та запровадити більш просунуті функції, ніж ми бачили раніше.
Загалом, Gen11 формує до значного оновлення для Санта-Клари. Перші два покоління AMD Ryzen Mobile зіткнулися з перегрітою графікою Skylake. Робзен мобільний APU третього покоління, коли він запускає, доведеться змагатися з чимось більшим. Повний документ доступний тут.
Читати далі

Intel випускає нові мобільні графічні процесори Xe Max для творців вмісту початкового рівня
Intel випустила новий споживчий мобільний графічний процесор, але він має дуже конкретний варіант використання, принаймні зараз.

Intel детально описує стратегію XPU, запускає новий серверний графічний процесор, OneAPI Gold
Сьогодні Intel зробила пару оголошень щодо своєї ініціативи OneAPI та запуску свого першого серверного графічного процесора на базі графіки Xe.

Nvidia представила графічний процесор Ampere A100 80 ГБ із пропускною здатністю 2 ТБ / с
Цього тижня Nvidia анонсувала графічний процесор Ampere A100 об'ємом 80 ГБ для розробників програмного забезпечення для штучного інтелекту, яким дійсно потрібно трохи місця для розгинання ніг.

PS5, Xbox Series X Тонкий на місці, поряд із центральними процесорами, графічними процесорами
Microsoft і Sony постачають усі апаратні засоби, які можуть, але це, здається, не дуже багато консолей. Однак не хвилюйтеся - все інше теж важко знайти.