Алдера Озеро Екстравагандза: Intel вивантажує деталі на його наступному гену CPU

Алдера Озеро Екстравагандза: Intel вивантажує деталі на його наступному гену CPU

На цьому тижні Intel поділяла значні відомості про сімейство Олдера Озеро CPU з набагато більше інформації, ніж ми раніше мали конструкцію, продуктивність та очікувану ефективність CPU.

Це критичний запуск для Intel. Настільний процесор виробника застряг на 14 нм протягом шести років, а тріщини в цьому технологічному вузлі показують принаймні два. Ракетно-озеро в даний час конкурентоспроможна з AMD на середньому та нижньому кінці ринку, якщо ви не дбаєте про ефективність енергії, але AMD має перевагу на високому кінці. Олексований озеро призначений для цього. Незважаючи на те, що Pat Gelsinger не був генеральним директором Intel досить довго, щоб мати багато введення в дизайн, він все ще є першим великим запуском свого перебування на посаді, і перший продукт, побудований на наступній ітерації Intel його 10NM вузла.

Через шість років застряг на 14 нм, Intel потрібно продемонструвати, що він може відкинути процес та керівництво. Ніхто не очікує, що це відбудеться протягом ночі, але Гельсжер має бізнес-модель Берззилла на результат. Замість того, щоб повертитися до ливарного партнерства з чистого п'єсу, а також відбуду від створення власного обладнання, оскільки деякі активістські фірми-фірми хотіли, Intel вирішила зробити гру з обох сторін ливарного бізнесу одночасно. Він буде продовжувати виробляти власні апаратні засоби, і це запропонує ливарне обслуговування та ліцензію X86 основних конструкцій для компаній, які хочуть придбати.

Intel мало зацікавленість у тому, щоб бути другого рівня ливарного виробництва або у переслідуванні договорів про виробництво товарів щодо недорогих чіпів, а капітальний характер його бізнесу, ймовірно, виключає таку стратегію у будь-якому випадку. Оскільки він створює свої власні чіпи, Intel може використовувати Олдер Озеро як доказ поліпшення конкурентоспроможності, за умови, що ЦП насправді доставляє цю обіцянку. Обличчя Олдера також є першим процесором X86, щоб зробити сторінку від книги Apple і розгорнути як "великі" і "маленькі" сердечники.

Зустріч Gracemont

Олексований озеро - це гібридний процесор, що містить два різних типи серцевих ядер. Сердечники ефективності базуються на архітектурі Gracemont, низькоефективної архітектури Intel, яка перетворилася з оригінального атом назад у 2008 році. Сердечники продуктивності базуються на новій архітектурі, золотому бухті. Це останні дрібні та великі стандарти Intel, а обидва нові конструкції. Давайте поговоримо про Gracemont першим:

Алдера Озеро Екстравагандза: Intel вивантажує деталі на його наступному гену CPU

Gracemont зберігає деякі елементи дизайну спільним з Tremont. Обидва CPU Corred пропонують подвійний 3 широкий декодерний блок, але Gracemont подвоюється на кеш-пам'яті інструкцій (64 КБ). Це другий раз Intel збільшив кеш інструкції L1; Тремонт зіткнувся з 24Кб до 32 кб кілька років тому. Процесор містить першу затребувану інструкцію Intel, а також велике збільшення загальної кількості портів виконання, від 10 до 17. Наприклад, тремтіння, Gracemont не вистачає гіпер-різьблення та є однополочним центром CPU.

За словами Intel: "Довжина навчання на вимогу, декодер декодує інструкції, щоб визначити, де починаються інструкції та закінчення. Вихід потім використовується для керування даними інструкції до декодерів, або його можна зберегти разом з інструкціями байти паралельно кешу інструкцій, щоб відзначити початок / закінчення майбутнього видобутку та декодування. " Це звучить як функція, яка може бути використана для компенсації інструкцій з змінної довжини x86 та може допомогти КПУ витягувати додаткову ефективність, надаючи йому додаткові відомості.

Алдера Озеро Екстравагандза: Intel вивантажує деталі на його наступному гену CPU

Gracemont може видавати п'ять інструкцій та вийти на вісім за цикл, де тремтіння може видавати чотири інструкції та вибух вісім, і це може вирішити дві гілки на цикл годин. Intel не перейшов до великої докладності щодо того, коли Gracemont може фактично декодувати та використовувати всі шість інструкцій на годинник - чіп має подвійні 3-х широкі кодери, а не 6-широкий розчин - але коли тремтіння запускається, Intel стверджував, що подвійні три -Wide декодери зберегли живлення та вмирає в порівнянні з великим мікро-операційним кеш-пам'яті або уніфікованим шестисемним декодером.

Алдера Озеро Екстравагандза: Intel вивантажує деталі на його наступному гену CPU

За словами Intel, "чотири ефективні сердечники пропонують 80 відсотків більше продуктивності, одночасно витрачаючи менше енергії, ніж два ядерних ядер, що виконують чотири нитки або однакова продуктивність пропускання при споживанні 80 відсотків менше енергії". Intel також стверджує, що Gracemont може забезпечити 40 відсотків більш одноположних продуктивності, ніж схід, у тому ж конверті потужності або ідентична продуктивність менш ніж за 40 відсотків потужності.

Алдера Озеро Екстравагандза: Intel вивантажує деталі на його наступному гену CPU

Одна справа, щоб мати на увазі при оцінці цих претензій, полягає в тому, що Intel не дає еталонний годинник швидкості або TDP. Великі переваги ефективності над схід, частково пояснюються тим, що слабка продуктивність процесора в діапазоні TDP Gracemont призначена для обслуговування. Core I3-6100U мав налаштовуваний TDP вниз 7,5 Вт та тактовою швидкістю 800 МГц при цьому ТДП. Якщо Intel порівнюється в межах низьких діапазонів ТДП та годинників, він пояснить величезну покращення ефективності.

Gracemont має загальний кеш L2, з кожним квадрочним обмін до 4 Мб L2, затримка L2, він підтримує AVX, AVX2 та AVX-VNNI. AVX-VNNI є частиною специфікації AVX-512, але Intel не вимагає повної підтримки AVX-512, і є декілька інструкцій AVX-512, які Gracemont не може виконати. Ці робочі навантаження будуть оброблятися золотою бухвом.

Ми підняли деякі додаткові слайди Intel у слайд-шоу нижче, якщо ви хочете отримати додаткову інформацію про Gracemont. Ви можете натиснути на кожному слайді, щоб відкрити його, повноцінний, у новому вікні.

Вітайте золоту бухту

Мантра для розвитку золотого бухту, за словами Intel, був "ширшим, швидшим, розумним", і це хороший спосіб узагальнення різних покращень до процесора. Золотий бухт спускається з ядра Willow Core всередині процесора Тігрового Озера Intel, але він містить значну кількість оновлень та вдосконалення цього дизайну.

Алдера Озеро Екстравагандза: Intel вивантажує деталі на його наступному гену CPU

Золотий бухт збільшує кількість фронтальних декодерів до шести, з чотирьох, і значно розширює ITLBS Intel. ЦП зараз підтримує 32-батовий декодування, з 16 байтами за цикл, а черга мікро-операцій трохи ширше. В даний час він підтримує 72 записи за нитку, а з 70, а мікро-операційний кеш може утримувати 4K Micro-OPS, від 2,25k. Обидва були збільшені швидкість кешування мікро-операційної швидкості та передньою пропускною здатністю.

Алдера Озеро Екстравагандза: Intel вивантажує деталі на його наступному гену CPU

В даний час є 12 портів виконання, з 10, з більш глибоким буфером повторного порядок (512 записів, з 352 у сонячному Cove / Willow Cove). Кеш L1 тепер підтримує три порти вантажу, з двох, і може обробляти 3 × 256-бітну навантаження або 2 × 512-бітні навантаження в одному циклі. Кеш даних L1 тепер 96KB (Tiger Cove упакований 64KB), з 16 PopEchvers та можливість підтримки чотирьох сторінок таблиці, з двох.

Алдера Озеро Екстравагандза: Intel вивантажує деталі на його наступному гену CPU

Golden Cove запропонує 1,25 Мб L2 для клієнтських обчислень (Flat Versus Tiger Lake) або 2 Мб у додатках центру обробки даних. Він також підтримує нові розширені розширення Matrix Matrix (AMX), які претензії Intel забезпечує збільшення мамонта в продуктивності AI. Використання VNNI, CPU Intel може виконувати інструкції з 256 INT8 за цикл. AMX дозволяє таку ж чіп для виконання інструкцій з 2,048 INT8 за цикл.

Алдера Озеро Екстравагандза: Intel вивантажує деталі на його наступному гену CPU

Це може суттєво покращити ефективність роботи між процесором Intel у відповідних заявках, хоча застосовуються звичайні застереження щодо прийняття та оптимізації SIMD. Може бути, за кілька років, перш ніж AMX значно використовує в комерційних програмах, але вигідність ефективності, що означають, що Intel CPU може бути розумною альтернативою для NVIDIA GPU для певних завдань AI та машинного навчання. CPU може вже виконувати навантажувальні навантаження AI на розумних швидкостях, тому це буде цікаво побачити, чи це покращує ефективність процесора у моделях навчання AI, або якщо вона просто робить їх більш конкурентоспроможними у висновнінні.

Додайте все це, і ось що ви отримуєте:

Алдера Озеро Екстравагандза: Intel вивантажує деталі на його наступному гену CPU

Цей слайд насправді трохи вводить в оману, на мій погляд, але не таким чином, що сприяє Intel. Одного разу, використовуючи ненульову відправну точку, фактично робить Intel подивитися гірше, не краще. Розрив продуктивності між ракетним озером та озером Алдером у найгіршому підрозділі - ~ 92 відсотка на далекій лівій частині графа, тоді як Олдер Озеро, як повідомляється, до 1,6x швидше у жменю тестів. Медіанський прибуток - 1,19X, за словами Intel.

Хоча Intel взяла велику кількість тепла за його невиконання нових технологічних вузлів протягом останніх шести років, збільшення продуктивності 119x з нового покоління продукту є респектабельним. Ракетно-озеро збільшило IPC порівняно з Comet Lake, але Intel довелося торгувати сердечникам, щоб зробити роботу ТДП. В результаті, у багатьох додатках широко в багатьох програмах широко в багатьох програмах є восьмиядерний RKL та 10-ядерний CML. Олексований озеро поєднує в собі до восьми золотих ядерних сердечників та 16 GC ниток з до восьми грунтових ядер Gracemont (кожен), для великого загальної кількості 16 сердечників та 24 ниток у верхній частині SKU.

Якщо ви хочете перевірити додаткові золоті каски Intel, ми склали їх у другій слайд-шоу нижче.

Примітка. Після того, як ребрендинг 10 нм кілька разів, Intel вирішила нову номенклатуру для його технологічних вузлів. Олдер озеро побудований на Intel 7 (без суфікса "НМ"). Intel 7 все ще 10nm вузол - це було б фірмовим "підвищеним суперфіном" під старою номенклатурою, але Intel стверджує 10-15 відсотків удосконалення продуктивності на WATT та різні оптимізації транзисторів FinFet. Більш детальна інформація про довгострокові плани оновлення вузлів Intel можна знайти тут.

Роблячи все це разом

Перетворюючі навантаження між малими та великими ядрами вимагає додаткової підтримки. Intel побудував покращений апаратний планування у свої чіпси, названий директор нитки. Тема директор контролює процесор і визначає, що кожна робоча навантаження закінчується відповідним ядром.

Алдера Озеро Екстравагандза: Intel вивантажує деталі на його наступному гену CPU

Хоча важко показати демонстрацію Intel дав нам або оцінити їх, не будучи рукоділлям, компанія дала приклад того, як директор нитки розповсюдженням декількох потоків по роботі та ефективності. На зображенні нижче, зелені завдання - скалярні навантаження, помаранчеві завдання представляють нову робочу навантаження AI, яка тільки запущена, а блакитні завдання є фоновими завданнями.

Алдера Озеро Екстравагандза: Intel вивантажує деталі на його наступному гену CPU

У відповідних умовах процесор буде запланувати робочі навантаження як у вигляді роботи, так і ефективності. Intel не розкриває, наскільки ймовірно, це повинно було виникнути при реальних умовах або які продуктивності, яке він очікував, що він очікував, що ядро ​​виграти, що використовує додаткову пропускну здатність, доступну від Gracemont.

Intel розроблений режисер із співпраці з Microsoft та Older Lake буде найкращим чином під Windows 11, хоча чіп також підтримує Windows 10. До запровадження директора нитки, планувальник операційної системи не мав жодного розуміння нитки, він працює або який ядро ​​не було Він повинен бути запланований. За словами Intel, директор з нитки закриває цей розрив і дає додаткову інформацію до ОС щодо планування. Чіп також може зробити рішення щодо планування навантаження з мікросекундним вірність, а планування є більш дрібнозернистим, ніж це було до введення Windows 11.

Алдера Озеро Екстравагандза: Intel вивантажує деталі на його наступному гену CPU

Тести вказали, що попередній гібридний процесор Intel, Lakefield, міг би забрати 5-6 відсотків під Windows 11 проти Windows 10. Lakefield не вистачає режисера Тема, тому ми хочемо побачити, як буде виглядати Дельта Олева Лейк-Лейк, як буде виглядати між двома операційними системами.

Алдера Озеро Екстравагандза: Intel вивантажує деталі на його наступному гену CPU

Хоча ці аспекти системи вже відомі, озеро Алдера запровадить підтримку PCIE 5.0 з 9W - 125W TDP конвертів. ADL пропонує 1 × 16 PCIE 5,0 доріжок, прикріплених до процесора, одноразового з'єднання X4 PCIE 4.0 та 16 смуг PCIE 3.0 та 4.0 через Southbridge. Материнські плати, швидше за все, матимуть можливість дозволити підтримувати PCIE 5.0, якщо один графічний графік підключений або відставка до 2 × 8 PCIE 4.0, якщо додається більше одного ГПУ. Один X8 PCIE 5.0 Link забезпечить таку ж кількість пропускної здатності як з'єднання X16 PCIE 4.0, тому не повинно бути ніякої смуги пропускання в жодній конфігурації, навіть у вимогливих робочих навантаженнях.

Висновок

Хоча ми не можемо зробити будь-які висновки про озеро Алдера, поки не будемо мати силікону в руках, глибина та широта виявлення Intel пропонують, що компанія відчуває себе впевненим у кінцевому продукті. A 1.19X IPC підняття є досить хорошим, особливо з урахуванням того, що RKL вдалося в основному зв'язати речі з CML останньою поколінням. Якщо восьмиядерний ракетний озеро може приблизно відповідати 10-ядерному озері Комета, восьмиядерний озеро Олдер повинен бути рішуче швидше у більшості завдань.

Intel не поділяв жодних основних даних або конкретних показників ефективності, але його розкриття вказує на значні прибутки як у ефективності енергії, так і сирої продуктивності. AMD - це прогнозування того, що його чіпси V-NAND, оснащена ZEN 3, отримає приблизно 1.15x у виконанні, але ще не розкриває будь-яку додаткову ефективність або зміну, що підвищує ефективність у будь-який майбутній CPU, він буде запущений в кінці цього року або на початку 2022 року.

Читати далі

Intel, Microsoft планує вивантажити антивірусне сканування на GPU
Intel, Microsoft планує вивантажити антивірусне сканування на GPU

Intel має нову ідею щодо підвищення продуктивності системи під час антивірусного сканування - завантаження всього навантаження на GPU.