Патент AMD Files на собственную реализацию чиплета GPU

AMD подала заявку на патент на подход к разработке графического процессора на основе чиплетов. Одна из ключевых целей этого подхода - создание более крупных конфигураций графических процессоров, чем это возможно при использовании одного монолитного кристалла.
AMD - третья компания, которая поделилась небольшой информацией о том, как она может подойти к этой проблеме, хотя это, вероятно, немного расширяет определение «совместного использования». Вы можете найти патент здесь - мы кратко рассмотрим предложения Intel и Nvidia, прежде чем говорить о регистрации патента AMD.

Intel ранее заявляла, что ее графический процессор для центров обработки данных Ponte Vecchio будет использовать новую архитектуру памяти (Xe-MF) с EMIB и Foveros. EMIB - это метод соединения разных микросхем в одном корпусе, в то время как Foveros использует большие переходные отверстия в кремнии для соединения аппаратных блоков вне кристалла с эффективным подключением на кристалле. Этот подход основан на технологии упаковки и межсоединений, разработанной Intel для собственного использования.

Nvidia предложила то, что она назвала многочиповым модульным графическим процессором или MC-GPU, который решал проблемы, присущие распределению рабочих нагрузок между несколькими графическими процессорами с помощью NUMA, с дополнительными функциями, предназначенными для уменьшения использования полосы пропускания внутри пакета, такими как кеш L1.5 он признал неизбежные штрафы за задержку при переключении между различными взаимосвязанными графическими процессорами.

Метод AMD предполагает, что чиплет графического процессора организован несколько иначе, чем то, что мы видели в 7-нм процессорах, выпущенных на сегодняшний день. Организовать GPU в эффективный дизайн чиплета может быть сложно из-за ограничений пропускной способности между чиплетами. Это меньшая проблема с процессорами, где ядра не обязательно взаимодействуют так много, и их не так много. Графический процессор имеет тысячи ядер, в то время как даже самые большие процессоры x86 имеют только 64.
Одна из проблем, которую Nvidia подчеркнула в своем документе 2017 года, заключалась в необходимости ослабить ограниченную полосу пропускания, доступную для связи между MC-GPU и MC-GPU. Предлагаемая компанией архитектура кэш-памяти L1.5 призвана решить эту проблему.
Реализация, описанная AMD выше, отличается от того, что предполагает Nvidia. AMD связывает оба процессора рабочих групп (шейдерные ядра) и GFX (блоки с фиксированной функцией) напрямую с кешем L1. Кэш L1 сам подключен к Graphics Data Fabric (GDF), который также соединяет L1 и L2. Кэш L2 связан с любым отдельным чиплетом, и любой блок WGP или GFX может считывать данные из любой части L2.
Чтобы подключить несколько микросхем GPU к единому процессору GPU, AMD сначала соединяет банки кэша L2 с пассивной перекрестной связью HPX, описанной выше, с помощью масштабируемой фабрики данных (SDF). Эта перекрестная ссылка выполняет работу по обмену данными между чиплетами. SDF на каждом чиплете соединяется между собой через пассивную перекрестную связь HPX - это одна длинная стрелка, соединяющая два чиплета выше. Эта перекрестная ссылка также прикрепляется к банкам кэша L3 на каждом чиплете. В этой реализации полосы GDDR подключены к кэш-памяти L3.
Патент AMD предполагает, что только один чипсет графического процессора подключается к процессору, а пассивное соединение связывает остальные вместе через большой общий кэш L3. MC-GPU от Nvidia не использует L3 таким образом.
Теоретически все это очень интересно, и мы уже видели, как AMD поставляет графический процессор с большим индикатором L3 на нем благодаря Infinity Cache от RDNA2. Будет ли AMD действительно поставлять детали, использующие чиплеты графического процессора, - это совсем другой вопрос, чем требуется ли ей патенты на различные идеи, которые она может захотеть использовать.
Разделение CPU и GPU по сути полностью меняет работу, которая изначально заключалась в их объединении. Одна из основных проблем, которые должен преодолеть подход с использованием чиплетов графического процессора, - это изначально более высокие задержки, возникающие при удалении этих компонентов друг от друга.
Многочиповые графические процессоры - это тема, которую AMD и Nvidia обсуждают годами. Этот патент не подтверждает, что какие-либо продукты появятся на рынке в ближайшем будущем, или даже что AMD когда-либо вообще приблизится к этой технологии.
Читать далее

Чиплеты - это и решение, и симптом более серьезной проблемы
Микросхемы - это новый метод создания микропроцессоров, но преимущества и улучшения следует понимать в контексте трудностей, которые они призваны устранить.