Встречайте RDNA: долгожданная новая архитектура графических процессоров AMD
Когда AMD запустила Graphics Core Next (GCN) в 2012 году, мало кто мог предположить, что эта архитектура GPU будет управлять графическими продуктами компании в течение почти десятилетия. GCN был эффективным дизайном для Team Red во многих отношениях - он способствовал успеху консольных предприятий Xbox One и PS4 - но он давно завоевал популярность. Высокие тактовые частоты всегда были сложны для AMD, чтобы поразить GCN, и AMD не может сравниться с Nvidia по общему энергопотреблению с 2013 года. Только Radeon Nano - высокопроизводительный GPU, построенный с энергоэффективным HBM и скомпонованный для лучшего в своем классе энергопотребление - было достаточно близко к соответствию энергоэффективности продуктов Nvidia Maxwell.
Если Navi обеспечит улучшения, которые AMD обещала, это будет самый важный выпуск GPU компании с 2012 года. Давайте посмотрим, что компания принесла на стол.
Обзор высокого уровня. Navi (или, по крайней мере, вариант RX 5700XT) содержит 40 CU с 64 ядрами в каждом, со 160 блоками наложения текстур и 64 ROPS. Для справки Vega 64 - это дизайн 4096: 256: 64. Учитывая, что AMD прогнозирует, что Navi будет в 1,14 раза быстрее, чем GTX 1080, а Vega 64 отстает от этой карты примерно на 8 процентов, это говорит о том, что Radeon 5700XT превзойдет Vega 64 примерно в 1,2 раза.
Это изображение суммирует изменения, внесенные с РДНК. RDNA позволяет выполнять волновые фронты в блоках из 32, а не 64. Волновой фронт - это группа операций, выполняемых на одной SIMD. Ранее AMD использовала только Wave64.
Использование фразы «CU» для описания этого распределения ядра кажется довольно странным. AMD помечает эту часть таким образом, с 64 ядрами на CU, но посмотрим, как на самом деле показана схема выше. Каждый из красных блоков содержит 32 подразделения. Это также верно для блоков GCN, но в этой архитектуре некоторые функции, такие как планировщик, были разделены между блоками. В RDNA эти возможности теперь специфичны для каждого набора блоков SIMD, и несколько блоков CU можно объединять для обработки рабочих нагрузок в определенных случаях, если компилятор считает, что это приведет к повышению производительности. Мы спрашивали об этом AMD (первоначальные брифинги были чрезвычайно сжаты, с ограниченным временем для вопросов).
Архитектурное глубокое погружение
На слайдах ниже мы более подробно расскажем о Navi. Можно щелкнуть каждый слайд, чтобы открыть его в новом окне.
Благодаря этим улучшениям Navi получает свои основные преимущества, показанные ниже:
По данным AMD, общая производительность на тактовую частоту увеличилась в 1,25 раза, а количество гейтов на такт сократилось. Эффективность энергопотребления существенно повысилась, заявив, что в 1,5 раза выше, чем GCN
Относительно небольшой процент от общего преимущества Navi связан с 7-нм кремнием, и AMD не объяснила, куда он потратил транзисторный бюджет чипа. Navi несколько крупнее Polaris, но имеет всего несколько ядер (2560 против 2304). Предположительно, некоторое количество транзисторов пошло на повышение тактовых частот, которые значительно выше, чем когда-либо достигал AMD GPU. Максимальная тактовая частота RX 580 составляет примерно 1340 МГц по сравнению с 1755 МГц, указанными для игровых часов Navi. Это улучшение в 1,3 раза.
Неархитектурные соображения
Со сцены на E3 AMD часто говорила о необходимости «дзенских» усилий, чтобы вернуть свой бизнес на GPU, но есть одно критическое различие между этими двумя ситуациями: время.
Если вы связываете усилия AMD Zen с решением нанять Джима Келлера для запуска продукта, то с августа 2012 года по апрель 2017 года потребовалось проектирование, сборка и запуск оборудования. До успеха Zen бюджеты AMD на исследования и разработки работали на ограниченных масштабах. Компания должна была выбрать, куда потратить свои деньги в 2012–2017 годах, и решила инвестировать эти деньги в создание лучшего процессора. Любые средства на расширение разработки графических процессоров поступили бы из двух источников: финансирование от Microsoft и Sony в обмен на дизайнерские работы для Xbox Next / PS5 и дополнительные продажи продуктов Ryzen. Продажи криптовалюты на GPU, возможно, обеспечили дополнительный источник дохода в конце 2017 года и в начале 2018 года, но AMD не могла планировать это, когда планировала свои исследования и разработки несколько лет назад. Помните, AMD никогда не выпускала новую высокопроизводительную архитектуру процессоров для настольных ПК с 2012 по 2017 год. Navi запускается менее чем через два года после Vega.
На основании данных, которые AMD продемонстрировала на сегодняшний день, Navi не сможет полностью сократить разрыв между собой и Team Green с точки зрения абсолютной энергоэффективности. Это не без прецедента. После катастрофического перебоя AMD с серией HD 2000 она опиралась на семейство HD 3000, чтобы обеспечить паритет производительности на рынке среднего и высшего среднего уровня. Семейство HD 4000 - это графические процессоры, которые фактически ставят компанию на первое место. Вполне возможно, что Navi - это первый шаг к лучшей, более конкурентоспособной производительности для AMD, а не последнее слово в этой теме. Были некоторые разговоры о том, представляет ли RDNA новую архитектуру, но это, безусловно, кажется. Чип был существенно переработан, он обрабатывает рабочие нагрузки совсем не так, как предыдущее ядро, и избавляет от некоторых определяющих характеристик GCN, включая ограничения по такту.
Вполне возможно, что, как и в случае с Zen, AMD решила включить первую волну улучшений в ядро графического процессора, которое, как она знала, могло бы быстро вывести на рынок, с дополнительными улучшениями и улучшениями, предназначенными для Navi 20, которая, по слухам, появится в следующем году. , 7-нм история компании по мощности и эффективности может продолжаться относительно быстро, если это правда.
Читать далее
RISC-V делает шаг навстречу мейнстриму с платой SiFive Dev Board и высокопроизводительным процессором
RISC V продолжает завоевывать рынок, на этот раз с более дешевой и более полнофункциональной тестовой материнской платой.
VIA Technologies и Zhaoxin укрепляют связи с разработчиками процессоров x86
VIA и Zhaoxin углубляют свое стратегическое партнерство за счет дополнительной передачи интеллектуальной собственности, предназначенной для ускорения долгосрочной разработки продукта.
Intel представляет новые мобильные графические процессоры Xe Max для создателей контента начального уровня
Intel выпустила новый потребительский мобильный графический процессор, но у него очень специфический вариант использования, по крайней мере, на данный момент.
Что значит для рынка ПК, если Apple сделает самый быстрый процессор?
M1 SoC от Apple может иметь огромное влияние на рынок ПК. По прошествии 25 лет x86 может больше не быть самой производительной архитектурой ЦП, которую вы практически можете купить.