Intel детальніше швидше Gen 11 графічної архітектури

Intel детальніше швидше Gen 11 графічної архітектури

Компанія Intel випустила новий проектний документ, який детально описує графічні процесори Gen 11 і як вони відрізнятимуться від попередньої сім'ї. До цього моменту ми отримали скромні подробиці щодо нового uarch, на подіях, таких як День архітектури Intel, але ці нові дані доповнюють деякі очікувані технічні деталі. Очікується, що графічна архітектура Gen 11 компанії Intel стане основою для майбутньої архітектури дискретного графічного процесора Xe, тому досягнуті успіхи тут є попереднім переглядом принаймні деяких функцій, які ці картки повинні розгортати.

Ми не збираємося прогнозувати продуктивність доти, доки ми не побачимо більше від основного обладнання, але, по всій видимості, Intel, принаймні, зможе набагато ефективніший виклик для AMD, ніж коли-небудь раніше. Історично, графічні процесори Intel GT2 в середньому діапазоні, які він встановлює на стільниці, і деякі мобільні чіпи були порівняно слабкими в порівнянні з AMD. Перевагою Intel у цих порівняннях є історична потужність процесора в порівнянні з БПЗ, отриманими від AMD. Тепер, коли Ryzen має набагато більш ефективне ядро ​​процесора, процесори Ryzen Mobile від AMD набагато ефективніше конкурують зі своїми колегами Intel.

Intel детальніше швидше Gen 11 графічної архітектури
Intel детальніше швидше Gen 11 графічної архітектури

Новий ядро ​​GPU за номерами. Продуктивність обчислень приблизно на 2.67x вище, як і пропускна здатність вибірки текстури. Пропускна здатність ROP збільшилася вдвічі, так само, як і кількість високих Z-тестів на годинник. Кеш L3 збільшився в 4 рази, а обсяг пропускної здатності, доступний для записів GPU, збільшився вдвічі - до 64 байт за годину. Пропускна здатність пам'яті при використанні DDR4 повинна бути однаковою, але підтримка LPDDR4 дозволяє теоретично підвищувати частоту пам'яті в парі з цим типом пам'яті. Кеш останнього рівня розподіляється між GPU і CPU для зменшення руху даних. Блоки декодера відео покращено для зменшення бітрейту, дозволяють багаторазове одночасне декодування 4K і 8K потоків, додають підтримку Adaptive Sync і покращують декодування HD-відео.

Intel детальніше швидше Gen 11 графічної архітектури

GPU тепер має спільну локальну пам'ять, яка не блокує доступ L3 під час читання. Intel стверджує, що це забезпечує підвищення ефективності для локальних і глобальних атомів.

Intel детальніше швидше Gen 11 графічної архітектури

Вся структура, вище. Компанія Intel стверджує, що вона значно покращила загальну ефективність пропускної здатності пам'яті за допомогою Gen 11. Це буде цікаво побачити, наскільки вірно це доводить і чи змінює вона загальні характеристики рішень Intel iGPU. Історично, AMG iGPUs були досить чутливі до пропускної здатності пам'яті, тоді як чіпи Intel були менш уражені годинником оперативної пам'яті. Ці зміни могли б зробити так, щоб годинник оперативної пам'яті також був більш цікавим для Intel.

Затінення грубих пікселів та втрачена місяць POSH

Дві основні особливості Gen 11 - це грубе піксельне затінення і POSH, що, очевидно, означає позицію Only Shading, а не якась сумнівна посилання на британську науково-фантастичну програму.

Затінення грубих пікселів зменшує навантаження на графічні процесори, зменшуючи кількість кольорових зразків, які використовуються для візуалізації зображення. Інші деталі, такі як геометрія, не масштабуються таким чином, щоб зберегти деталі сцени. Зменшення кількості виконаних піксельних шейдерів може заощадити енергію та підвищити продуктивність. Піднесення на день архітектури Intel від CPS було у діапазоні 20-40 відсотків залежно від того, наскільки активована функція. 2 × 2 мали мінімальний вплив на візуальні ефекти і поліпшену продуктивність за помірною величиною, 4 × 4 було набагато більш помітним, але також пропонувалося більше підняття.

Intel детальніше швидше Gen 11 графічної архітектури

Труба POSH, про яку ми говорили вище, є частиною системи позиціонування на основі плитки (PTBR) корпорації Intel, яка розгортає дві трубопроводи геометрії - стандартну трубу візуалізації та трубопровід POSH. Intel стверджує, що:

Труба POSH виконує шейдер позиції паралельно з головним додатком, але зазвичай генерує результати набагато швидше, оскільки він лише відтінкує атрибути позиції і уникає візуалізації пікселів. Труба POSH проходить попереду і використовує зафарбований атрибут положення, щоб обчислити інформацію про видимість для трикутників, щоб визначити, чи вони вилучені чи ні. Блок запису видимості об'єкта труби POSH обчислює видимість, стискає інформацію і записує її в пам'ять.
Труба POSH виконує шейдер позиції паралельно з головним додатком, але зазвичай генерує результати набагато швидше, оскільки він лише відтінкує атрибути позиції і уникає візуалізації пікселів. Труба POSH проходить попереду і використовує зафарбований атрибут положення, щоб обчислити інформацію про видимість для трикутників, щоб визначити, чи вони вилучені чи ні. Блок запису видимості об'єкта труби POSH обчислює видимість, стискає інформацію і записує її в пам'ять.

Труба POSH виконує шейдер позиції паралельно з головним додатком, але зазвичай генерує результати набагато швидше, оскільки він лише відтінкує атрибути позиції і уникає візуалізації пікселів. Труба POSH проходить попереду і використовує зафарбований атрибут положення, щоб обчислити інформацію про видимість для трикутників, щоб визначити, чи вони вилучені чи ні. Блок запису видимості об'єкта труби POSH обчислює видимість, стискає інформацію і записує її в пам'ять.

Теоретично, POSH має бути більш швидким, більш енергоефективним способом обробки певних типів обробки геометрії. Загальна продуктивність та застосовність до робочих навантажень, швидше за все, залежатимуть від типу режиму рендерингу, який використовують ігри. Тим не менш, Intel чітко думає про те, як максимально збільшити пропускну здатність пам'яті та запровадити більш просунуті функції, ніж ми бачили раніше.

Загалом, Gen11 формує до значного оновлення для Санта-Клари. Перші два покоління AMD Ryzen Mobile зіткнулися з перегрітою графікою Skylake. Робзен мобільний APU третього покоління, коли він запускає, доведеться змагатися з чимось більшим. Повний документ доступний тут.

Читати далі

Бета-тести швидкості Starlink бета-тестують традиційний супутниковий Інтернет
Бета-тести швидкості Starlink бета-тестують традиційний супутниковий Інтернет

За даними Ookla Speedtest та проаналізованими нашими колегами з PCMag, Starlink відповідає своїм високим вимогам щодо швидкості.

Астрономи, нарешті, можуть знати джерело швидких радіостанцій
Астрономи, нарешті, можуть знати джерело швидких радіостанцій

Тріо нових досліджень повідомляють про FRB у нашій власній галактиці. Оскільки цей сигнал був набагато ближчим, ніж минулі сигнали, вчені змогли відстежити його до певного типу нейтронної зірки, відомого як магнітар.

Новий SoC від M1 від Apple виглядає чудово, він не швидший за 98 відсотків ноутбуків для ПК
Новий SoC від M1 від Apple виглядає чудово, він не швидший за 98 відсотків ноутбуків для ПК

Новий кремній M1 від Apple справді виглядає приголомшливо, але це не швидше 98 відсотків проданих ПК минулого року, незважаючи на те, що заявляє компанія.

Що це означає для ринку ПК, якщо Apple робить найшвидший процесор?
Що це означає для ринку ПК, якщо Apple робить найшвидший процесор?

SoC від M1 від Apple може мати глибокий вплив на ринок ПК. Через 25 років x86 може перестати бути найефективнішою архітектурою центрального процесора, яку ви практично можете придбати.