ALDER Lake Everavaganza: Intel Unloads Детали на своем процессоре следующего поколения

ALDER Lake Everavaganza: Intel Unloads Детали на своем процессоре следующего поколения

На этой неделе Intel поделилась значительными деталями на своей семье Ольси-Лейк-КПУ с гораздо большей информацией, чем ранее, о котором мы рассматривали проектирование CPU Core, производительности и ожидаемой энергоэффективности.

Это критический запуск для Intel. Настольные процессоры производителя были застряли на 14 нм уже более шести лет, а трещины в этом узле процесса отображаются не менее двух. Ракетное озеро в настоящее время конкурентоспособно с AMD на Midrange и более низком уровне рынка до тех пор, пока вы не заботитесь о энергоэффективности, но AMD имеет преимущество на высоком уровне. Озеро Ольдер предназначено для того, чтобы изменить это. Хотя Pat Gelsinger не был генеральным директором Intel достаточно долго, чтобы иметь много ввода в дизайн, оно все еще первый крупный запуск его пребывания и первого продукта, построенного на следующей итерации Intel на 10 нем.

Через шесть лет застрял 14 нм, Intel должен продемонстрировать, что он может повторно получить процесс и руководство по производительности. Никто не ожидает, что это произойдет на ночь, но Геллингер сделал бизнес-модель Chipzilla в результате. Вместо того, чтобы вращаться в отношении литейных партнерств Pure-Play и вдали от создания собственного оборудования, так как некоторые хотели бы некоторые фирмы активистских инвесторов, Intel решил сделать игру для обеих сторон литейного бизнеса одновременно. Он будет продолжать изготовлять собственное оборудование, и он предложит литейные услуги и лицензию X86 Core Core Consure для компаний, которые хотят покупать.

Intel мало интерес к тому, чтобы быть литейном для второго уровня или в проведении контрактов по производству товарных товаров на недорогие чипсы, а капиталоемкий характер своего бизнеса, вероятно, препятствует такой стратегии в любом случае. Поскольку он строит свои собственные чипсы, Intel может использовать озеро Алдер в качестве доказательства улучшения конкурентоспособности, при условии, что ЦП на самом деле доставляет это обещание. Озеро олдер также является первым процессором X86, чтобы сделать страницу из книги Apple и развернуть как «большие» и «маленькие» ядра.

Встретить Грасемонт

Озеро ольха представляет собой гибридный процессор, содержащий два разных типа CPU Cores. Сердечники эффективности основаны на Gracemont, низкоэнергетической архитектуре Intel, которая превратилась из исходного атома обратно в 2008 году. Сердечники производительности основаны на новой архитектуре, Золотой бухте. Это последние небольшие ядро ​​и крупные стандарты Intel, и оба являются новыми конструкциями. Давайте сначала поговорим о Gracemont:

ALDER Lake Everavaganza: Intel Unloads Детали на своем процессоре следующего поколения

Gracemont сохраняет некоторые элементы дизайна общего с Tremont. Оба сердечника CPU предлагают двойную 3-широкую декодерную единицу, но Gracemont удваивается на кэш-памяти инструкций (64 КБ). Это второй раз, когда Intel увеличил кэш инструкции L1; Тремонт наткнулся с 24 КБ до 32 КБ несколько лет назад. ЦП содержит первый декодер инструкций Intel Intel и большой рост общего количества портов выполнения, от 10 до 17. Как Cremont, Gracemont отсутствует Hyper-Threading и является однопоточным CPU CPU.

Согласно Intel: «Декодер длины инструкции по требованию декодирует данные инструкции, чтобы определить, где начинаются инструкции и конец. Затем вывод используется для управления данные инструкции в декодеры, либо можно сохранить вместе с помощью байтов инструкций, параллельных к кэше инструкции, чтобы пометить начало / конец на будущей приеме и декодировании ». Это звучит, как функция, которая может быть использована для компенсации инструкций переменной длины X86 и может помочь экстрактам CPU дополнительную эффективность, придавая ему дополнительную информацию.

ALDER Lake Everavaganza: Intel Unloads Детали на своем процессоре следующего поколения

Грасемонт может выпустить пять инструкций и уйти в отставку восьми за цикл, где Tremont может выдать четыре инструкции и уйти в отставку восьми, и он может разрешить две ветви за часы. Intel не входил в подробную информацию о том, когда Gracemont может фактически декодировать и использовать все шесть инструкций на часы - чип имеет двойные 3-самые кодировщики, а не 6-ти широкое решение - но когда Cremont запущен, Intel утверждал, что двойной три -Видные декодеры сохраняли пространство питания и умирания по сравнению с большим кэшем микро-оп или единым декодером.

ALDER Lake Everavaganza: Intel Unloads Детали на своем процессоре следующего поколения

Согласно Intel, «четыре эффективных ядра предлагают на 80 процентов больше возможностей, которые все еще потребляем меньше энергии, чем на двух ядерных ядрах, выполняющих четыре нити или одинаковую производительность пропускной способности во время потребления 80 процентов меньше энергии». Intel также утверждает, что Gracemont может доставить на 40 процентов большего резьбовых характеристик, чем Skylake в той же мощности или одинаковом исполнении менее чем на 40 процентов.

ALDER Lake Everavaganza: Intel Unloads Детали на своем процессоре следующего поколения

Одно следует помнить при оценке этих претензий, заключается в том, что Intel не дает ссылочной часов или TDP. Большие преимущества эффективности над Skylake могут быть частично объяснены, что слабые характеристики ЦП в диапазонах TDP Gracemont предназначены для обслуживания. Ядро I3-6100U имел конфигурируемый TDP на 7,5 Вт и тактовой скорости 800 МГц на этом TDP. Если Intel сравнивается в пределах низких диапазонов и часов TDP, он объяснил бы огромное улучшение эффективности.

Gracemont имеет общий кэш L2, с каждым четырехъядерным делом до 4 МБ L2, 17-цикла L2 L2, а также поддерживает AVX, AVX2 и AVX-VNNI. AVX-VNNI является частью спецификации AVX-512, но Intel не претендует на полную поддержку AVX-512, и есть несколько инструкций AVX-512, которые Gracemont не могут выполнить. Эти рабочие нагрузки будут обрабатываться Золотой бухтой.

Мы заправили некоторые дополнительные слайды Intel в слайд-шоу ниже, если вы хотите больше информации о Gracemont. Вы можете нажать на каждый слайд, чтобы открыть его, полноразмерный, в новом окне.

Приветствовать золотую бухту

Мантра для развития золотой бухты, по мнению Intel, была «шире, быстрее, умнее», и это хороший способ обобщать различные улучшения процессора. Золотая бухта спускается от ядра Willow Cove Hear внутри процессора TIGER INTEL TIGER, но он содержит значительное количество обновлений и улучшений по этому дизайну.

ALDER Lake Everavaganza: Intel Unloads Детали на своем процессоре следующего поколения

Золотая бухта увеличивает количество передних декодеров до шести, вверх от четырех, и она значительно расширяет ITEL ITLBS. CPU теперь поддерживает 32-байтовое декодирование, вверх от 16 байт за цикл, а в очередь микрооперации немного шире. Теперь он поддерживает 72 записей на тему, по сравнению с 70, а микро-операционный кэш может удерживать 4К микро-опс, вверх от 2,25 к. Скорость удара кэша микро-пи и пропускной способности в интернет-пропускной способности.

ALDER Lake Everavaganza: Intel Unloads Детали на своем процессоре следующего поколения

Существует сейчас 12 портов выполнения, по сравнению с 10, с более глубоким перенаправленным буфером (512 записей, вверх от 352 в бухте Солнечная бухта / ивы). Кеш L1 теперь поддерживает три порта нагрузки, вверх из двух и могут обрабатывать 3 × 256-битных нагрузок или 2 × 512-битных нагрузок в одном цикле. Кэш данных L1 теперь составляет 96 КБ (Tiger Cove, упакованные 64КБ), с 16 предпринимателями и способностью поддержать четыре прогулки на четыре страницы, вверх с двух.

ALDER Lake Everavaganza: Intel Unloads Детали на своем процессоре следующего поколения

Золотая бухта будет предлагать либо 1,25 МБ L2 для клиентских вычислений (плоские по сравнению с озером Tiger) или 2 МБ в приложениях центра обработки данных. Он также поддерживает набор расширений Intel New Advanced Matrix Extensions (AMX), который претензии Intel обеспечивает увеличение мамонта в производительности AI. Использование VNNI, Intel CPU может выполнять 256 инструкций INT8 на цикл. AMX позволяет один и тот же чип выполнять 2 048 INT8 инструкций на цикл.

ALDER Lake Everavaganza: Intel Unloads Детали на своем процессоре следующего поколения

Это может существенно улучшить производительность AI на основе CPU Intel в соответствующих приложениях, хотя обычные предостережения о применении и оптимизации SIMD. Это может быть несколько лет до того, как AMX может многое использовать в коммерческих приложениях, но повышение производительности подразумевает процессор Intel CPU, может представлять собой разумную альтернативу GPUS NVIDIA для определенных задач, связанных с изучением AI. CPU уже могут выполнять рабочие нагрузки AI на разумных скоростях, поэтому будет интересно посмотреть, что улучшится эффективность процессора в обучении моделей AI или, если она просто делает их более конкурентоспособными в выводе.

Добавьте все это и вот что вы получаете:

ALDER Lake Everavaganza: Intel Unloads Детали на своем процессоре следующего поколения

Это слайд на самом деле немного вводит в заблуждение, на мой взгляд, но не таким образом, что способствует Intel. На этот раз, используя ненулевую отправную точку на самом деле делает Intel выглядеть хуже, не лучше. Разрыв производительности между ракетным озером и озером ольза в худшем выполнении подзадача составляет ~ 92 процента на дальней левой части графика, а озеро ольха, как сообщается, до 1,6 раза быстрее в нескольких тестах. Среднее усиление составляет 1,19x, согласно Intel.

В то время как Intel за последние шесть лет Intel потребовала много тепла в течение последних шести лет, увеличение производительности 1.19x с нового поколения продукта является респектабельным. Ракетное озеро Увеличено IPC по сравнению с озером Comet, но Intel пришлось торговать сердечниками, чтобы сделать работу TDP. В результате восемь ядра RKL и 10-ядер CML широко похожи во многих приложениях. Озеро оз озером сочетает в себе до восьми ядер Golden Cove и 16 потоков GC до восьми ядер Gracemont (1t каждый), для грандиозного общего объема 16 ядер и 24 нити в верхнем концевом SKU.

Если вы хотите проверить дополнительные слайды Intel Holden Cove, мы скомпилировали их на вторую слайд-шоу ниже.

ПРИМЕЧАНИЕ. После ребрендинга 10 нм несколько раз Intel урегулирован на новую номенклатуру для его технологических узлов. Озеро олдер построено на Intel 7 (без суффикса «НМ»). Intel 7 по-прежнему является узлом 10nm - он был бы фирменным «усовершенствованным суперфином» под старой номенклатурой - но Intel претендует на улучшение на 10-15 процентов в производительности на ватт и различные оптимизации транзисторов Finfet. Более подробную информацию о долгосрочных планах обновлений Intel можно найти здесь.

Сделать все это работать вместе

Рабочие нагрузки с шардировкой между маленькими и большими сердечниками требуют дополнительной поддержки. Intel разработал улучшенное оборудование, планирующее в его чипсы, назвала режиссер по никам. Резервущий директор мониторирует ЦП и уверенно, что каждая рабочая нагрузка заканчивается на соответствующем ядре.

ALDER Lake Everavaganza: Intel Unloads Детали на своем процессоре следующего поколения

Хотя трудно показать, что демонстрация Demos Intel дала нам или оценить их, не будучи практическими возможностями, компания привела пример того, как Direct Direction будет распространять несколько потоков по всей характеристике и эффективности. На рисунке ниже зеленые задачи представляют собой скалярные рабочие нагрузки, оранжевые задачи представляют собой новую рабочую нагрузку AI, которая только что запущена, а синие задачи являются фоновыми задачами.

ALDER Lake Everavaganza: Intel Unloads Детали на своем процессоре следующего поколения

При соответствующих условиях ЦП будет запланировать рабочие нагрузки по всей характеристике и эффективности. Intel не раскрывала, насколько вероятно, что это должно произойти в реальных условиях или какое повышение производительности ожидалось, что «ядра P для получения дополнительной пропускной способности доступна от Gracemont.

Директор по никам Intel в сотрудничестве с Lake Microsoft и озером Microsoft и ALDER будет работать лучше под управлением Windows 11, хотя чип также поддерживает Windows 10. До введения резервного директора, планировщик операционной системы не имел понимания в потоке, или какой ядро Это должно быть запланировано. Согласно Intel, Direction Director закрывает этот разрыв и обеспечивает дополнительную информацию в ОС относительно планирования. Чип также способен принимать решения о планировании рабочей нагрузки с микросеконной верностью и планированием более мелкозернистые, чем перед введением Windows 11.

ALDER Lake Everavaganza: Intel Unloads Детали на своем процессоре следующего поколения

Тесты указали, что предыдущий гибридный процессор Intel Hybrid, Lakefield, мог бы забрать 5-6 процентов под Windows 11 по сравнению с Windows 10. Lakefield не хватает диреводства по никам, поэтому нам интересно посмотреть, как будет выглядеть дельта озера озера между двумя операционными системами.

ALDER Lake Everavaganza: Intel Unloads Детали на своем процессоре следующего поколения

Хотя эти аспекты системы уже известны, озеро оз озером введет поддержку и масштаб PCIE 5.0 от 9W - 125W конвертов TDP. ADL предлагает 1 × 16 классов PCIE 5.0, прикрепленные к ЦП, одному соединению X4 PCIE 4.0 и 16 полосы PCIE 3.0 и 4.0 через Southbridge. Поставщики материнской платы, вероятно, будут иметь возможность включить поддержку PCIE 5.0, если один GPU подключен или падает на 2 × 8 ссылок PCIE 4.0, если прикреплен более одного GPU. Одна ссылка X8 PCIE 5.0 обеспечит такое же количество полосы пропускания как соединение PCIE X16 PCIE 4.0, поэтому не должно быть наказания пропускной способности в любой конфигурации, даже в требовательных рабочих нагрузках.

Вывод

Хотя мы не можем рисовать какие-либо выводы о озере олдера, пока у нас нет кремния в руке, глубина и широта добычи Intel предлагают, компания чувствует себя уверенно в конечном продукте. Uplift IPC 1.19x довольно хорош, особенно учитывая, что RKL удалось в основном связать вещи с помощью CML последнего поколения. Если восьмизерное ракетное озеро может примерно соответствовать 10-ядрому озеру Comet, восьмиъядерное озеро ольха должно быть решительно быстрее в большинстве задач.

Intel не разделял никаких жестких базовых данных или конкретных показателей производительности, но его раскрытие указывает на значительные выгоды как эффективность мощности, так и в сырой производительности. AMD прогнозирует, что его V-NAND оснащены чипами ZEN 3, получит примерно 1.15X в производительности, но еще не раскрыло никаких дополнительных эффективности или изменений на повышение производительности в любые будущие процессоры, оно запускает поздний в течение 2022 года.

Читать далее

Новые детали Intel Rocket Lake: обратная совместимость, графика Xe, Cypress Cove
Новые детали Intel Rocket Lake: обратная совместимость, графика Xe, Cypress Cove

Intel опубликовала немного больше информации о Rocket Lake и его 10-нм процессоре, который был перенесен на 14-нм.

Gigabyte LEAKS AMD ZEN 4 Детали: 5nm, AVX-512, 96 ядер, 12-канальный DDR5
Gigabyte LEAKS AMD ZEN 4 Детали: 5nm, AVX-512, 96 ядер, 12-канальный DDR5

Новые детали просочились на будущих процессорах AMD Genoa, основанные на нарушении гигабайтных серверов на прошлой неделе.

Раймбус разделяет новые детали по предстоящему спецификации HBM3
Раймбус разделяет новые детали по предстоящему спецификации HBM3

Мы знаем немного больше о HBM3, чем раньше, благодаря недавному объявлению Раймбуса. Новый стандарт предложит через Terabyte полосы пропускания памяти на стек.

AMD открывает новые детали Ryzen V-Cache на Hotchips 33
AMD открывает новые детали Ryzen V-Cache на Hotchips 33

AMD раскрыл более подробную информацию о своем предстоящем V-кэш в горячие чипсы 33 в этом году.