RTX 2080 против Radeon VII против 5700 XT: производительность рендерин

Большая часть нашего охвата GPU сфокусирована на потребительской стороне бизнеса и на тестировании игр, но я обещал изучить вычислительную сторону производительности еще во время запуска Radeon VII. С 5700 XT, недавно дебютировавшим, у нас была возможность вернуться к этому вопросу с новой архитектурой GPU от AMD и сравнить RDNA с GCN.

На самом деле, общая вычислительная ситуация находится на интересном перекрестке. AMD заявила, что хочет быть более серьезным игроком в корпоративных вычислительных средах, но также заявила, что GCN будет продолжать существовать вместе с RDNA в этом пространстве. Radeon VII - это потребительский вариант ускорителя AMD MI50 с поддержкой полускоростной FP64. Если вы знаете, что вам нужно вычисление FP64 с двойной точностью, например, Radeon VII заполняет эту нишу так, как никакой другой графический процессор в этом сравнении не делает.

Radeon VII обладает самой высокой пропускной способностью ОЗУ и является единственным графическим процессором в этом сравнении, обеспечивающим высокую производительность с двойной точностью. Но хотя эти графические процессоры имеют относительно схожие бумажные характеристики, между ними существует существенное расхождение с точки зрения производительности - и цифры не всегда нарушают то, что вы думаете.

Относительно Blender 2.80

Результаты нашего теста содержат данные как от Blender 2.80, так и от отдельного бенчмарка Blender 1.0beta2 (выпущен в августе 2018 года). Blender 2.80 является основным выпуском приложения и содержит ряд значительных изменений. Автономный тест не совместим с семейством RTX от Nvidia, что требовало тестирования с использованием последней версии программного обеспечения. Первоначально мы тестировали бета-версию Blender 2.80, но затем окончательная версия упала, поэтому мы сбросили результаты бета-тестирования и провели повторную проверку.

Существуют значительные различия в производительности между тестом Blender 1.0beta2 и 2.80, и одна сцена, Classroom, не отображается должным образом в новой версии. Эта сцена была исключена из наших 2.80 сравнений. Blender позволяет пользователю указывать размер плитки в пикселях, чтобы контролировать, сколько сцены обрабатывается одновременно. Код в файлах Python бенчмарка Blender 1.0beta2 указывает, что в тесте используется размер мозаичного фрагмента 512 × 512 (координаты X / Y) для графических процессоров и 16 × 16 для процессорных. Однако большинство файлов сцен, фактически содержащихся в бенчмарке, по умолчанию используют размер плитки 32 × 32, если они загружены в Blender 2.80.

Мы тестировали Blender 2.80 в двух разных режимах. Сначала мы протестировали все совместимые сцены, используя размер мозаики по умолчанию, в который загружены эти сцены. Это было 16 × 16 для Barbershop_Interior и 32 × 32 для всех других сцен. Затем мы протестировали те же рендеры с размером плитки по умолчанию 512 × 512. До сих пор правило с размерами листов было то, что большие размеры были хороши для графических процессоров, в то время как меньшие размеры были хороши для процессоров. Похоже, что это немного изменилось с Blender 2.80. Графические процессоры AMD и Nvidia демонстрируют очень разные отклики на большие размеры плиток: графические процессоры AMD ускоряются при увеличении размеров плиток и графические процессоры Nvidia теряют производительность.

Поскольку файлы сцен, которые мы тестируем, были созданы в более старой версии Blender, возможно, это повлияет на наши общие результаты. В течение нескольких недель мы интенсивно работали с AMD, чтобы изучить аспекты производительности Blender на графических процессорах GCN. GCN, Паскаль, Тьюринг и РДНК демонстрируют различную структуру результатов при переходе с 32 × 32 на 512 × 512, при этом Тьюринг теряет меньшую производительность, чем Паскаль и РДНК, и в большинстве случаев получает большую производительность, чем GCN.

Все наши графические процессоры значительно выиграли от того, что не использовали размер плитки 16 × 16 для Barbershop_Interior. Хотя этот тест по умолчанию равен 16 × 16, он не очень хорошо рендерится при таком размере тайла на любом графическом процессоре.

Устранение различных результатов, которые мы увидели в бенчмарке Blender 1.0Beta2 по сравнению с бета-версией Blender 2.80 и, наконец, финалом Blender 2.80 задержал этот обзор в течение нескольких недель, и во время работы над ним мы обменялись несколькими драйверами AMD. Поэтому все результаты Blender 2.80 были выполнены с использованием Adrenaline 2019 Edition 19.8.1.

Настройка теста и примечания

Все графические процессоры были протестированы на системе Intel Core i7-8086K с использованием материнской платы Asus Prime Z370-A. Vega 64, Radeon RX 5700 XT и Radeon VII были протестированы с использованием Adrenalin 2019 Edition 19.7.2 (16.07.2009) для всего, кроме Blender 2.80. Все тесты Blender 2.80 были выполнены с использованием 19.8.1, а не 19.7.2. Nvidia GeForce GTX 1080 и Gigabyte Aorus RTX 2080 были протестированы с использованием драйвера Nvidia 431.60 Game Ready (23.07.2009).

CompuBench 2.0 проводит графические процессоры через серию тестов, предназначенных для измерения различных аспектов их вычислительной производительности. Однако разработчики CompuBench Кишонти, похоже, не предлагают какой-либо существенной разбивки того, как они разработали свои тесты. Моделирование набора уровней может относиться к использованию наборов уровней для анализа поверхностей и форм. Подразделение Catmull-Clark - это техника, используемая для создания гладких поверхностей. Моделирование N-тела - это моделирование динамических систем частиц под действием таких сил, как гравитация. Оптический поток TV-L1 - это реализация метода оценки оптического потока, используемого в компьютерном зрении.

SPEC Workstation 3.1 содержит много тех же самых рабочих нагрузок, что и SPECViewPerf, но также имеет дополнительные вычислительные рабочие нагрузки на GPU, которые мы разберем отдельно. Полное описание теста рабочей станции и его набора приложений можно найти здесь. Рабочая станция SPEC 3.1 была запущена в собственном тестовом режиме 4K. Хотя этот тестовый прогон не был представлен в SPEC для официальной публикации, наше тестирование рабочей станции SPEC 3.1 подчинялось установленным в организации правилам тестирования, которые можно найти здесь.

Мы подготовили для вас два набора результатов - синтетическую серию тестов, созданных с помощью SiSoft Sandra, и исследуют различные аспекты сравнения этих чипов, включая вычислительную мощность, задержку памяти и внутренние характеристики, а также более широкий набор тестов, которые касаться производительности вычислений и рендеринга в различных приложениях Поскольку тесты SiSoft Sandra 2020 являются уникальными для этого приложения, мы решили разбить их на собственное слайд-шоу.

Результаты Gigabyte Aorus RTX 2080 следует считать приблизительно эквивалентными RTX 2070S. Два графических процессора работают почти одинаково в рабочих нагрузках потребителя и должны соответствовать друг другу на рабочей станции.

SiSoft Sandra 2020

SiSoft Sandra - это универсальная служебная информация о системе и полнофункциональный пакет для оценки производительности. Несмотря на то, что это синтетический тест, он, вероятно, является наиболее полнофункциональной утилитой синтетического анализа, и Адриан Силаси, ее разработчик, десятилетиями совершенствовал и улучшал ее, добавляя новые функции и тесты по мере развития процессоров и графических процессоров.

Наши специфические результаты SiSoft Sandra приведены ниже. Некоторые из наших результатов OpenCL немного странны в отношении 5700 XT, но, по словам Адриана, у него еще не было возможности оптимизировать код для выполнения на 5700 XT. Считайте эти результаты предварительными - интересными, но, возможно, еще не показательными - в отношении этого графического процессора.

Универсальный тест GPGPU Sandra измеряет производительность в нескольких показателях; мы решили сосредоточиться на производительности с плавающей точкой с половинной точностью, одинарной точностью и двойной точностью. Radeon VII предлагает гораздо более сильную поддержку с плавающей запятой двойной точности, что отражается в его гораздо более высоких результатах тестов. RTX 2080 побеждает в этом тесте с точки зрения производительности FPU половинной точности, связан с одинарной точностью и не отличается от DP.

RX 5700 XT не удалось в этом тесте при запуске с OpenCL. Огромная пропускная способность памяти Radeon VII дает ему преимущество над RTX 2080 во всех режимах тестирования, в то время как Vega 64 предлагает конкурентоспособную производительность шифрования / дешифрования и криптографии, но отстает от RTX 2080 в рабочей нагрузке хэширования.

Мы нарушили тест Блэка-Шоулза из других оценок финансовой модели, потому что различия в производительности были слишком большими, чтобы правильно составить график. Тест OpenCL с низкой точностью в значительной степени благоприятствовал Radeon VII, в то время как 5700 XT и RTX 2080 были в равных условиях. Высокая точность Vega 64 значительно лучше, чем у 5700 XT, но опять же, оптимизация может сыграть здесь важную роль. Чем меньше сказано о GTX 1080, тем лучше.

Для научного анализа мы сосредоточились на общем умножении матриц. Показатели производительности здесь в целом соответствуют результатам, которые мы каталогизировали в предыдущих тестах.

Тест Сандры по обработке изображений показывает, что Radeon VII лидирует по всем остальным картам, хотя Vega 64 демонстрирует здесь хорошие результаты. Низкая производительность Radeon VII может быть связана с оптимизацией OCL.

Как и в случае с процессорами, максимальная полезная пропускная способность памяти всегда ниже максимальной теоретической. Версия этого теста, проведенная Сандрой, показывает более низкие показатели, чем мы могли ожидать, но единственным настоящим сюрпризом является 5700 XT, превосходящий Vega 64.

Сначала мы проверили задержку ОЗУ с OCL / CUDA, но результаты не выглядели правильно. Различные типы шаблонов доступа к кэшу имеют очень разные задержки, но задержка в 924 нс для полной случайной выборки на 5700 XT была странной. Задержки ОЗУ не показали какого-либо особого отношения к шаблонам производительности в Сандре или в других тестах.

Мы проверили задержку ОЗУ с D3D11 вместо OpenCL / CUDA, чтобы увидеть, изменит ли это окончательные результаты. Показатели GCN и RDNA значительно улучшились в этом API, хотя Radeon 5700 XT по-прежнему показывал странные результаты.

Наши тесты SiSoft Sandra 2020 указывают в основном на то же направление. Если вам нужна двойная точность с плавающей точкой, Radeon VII - вычислительный монстр. Хотя неясно, сколько покупателей попадает в эту категорию, есть определенные места, такие как обработка изображений и высокоточные рабочие нагрузки, где сияет Radeon VII.

Radeon 5700 XT на основе RDNA делает меньше, чтобы отличиться в этих тестах, но мы также связываемся с Silasi по вопросам, с которыми мы столкнулись во время тестирования. Улучшенная поддержка может изменить некоторые из этих результатов в ближайшие месяцы.

Результаты теста

Теперь, когда мы рассмотрели производительность Sandra, давайте обратимся к остальной части нашего набора тестов. Наши другие результаты включены в слайд-шоу ниже:

IndigoBench - это автономный тест рендеринга, основанный на Indigo Render, объективном фотореалистичном графическом процессоре и процессоре. Производительность измеряется миллионами выборок в секунду, а производительность Core i7-8086K предоставлена для справки. В первой сцене, Спальня, Radeon RX 5700 XT опережает Radeon VII и Vega 64, упав только до RTX 2080. Разрыв между Nvidia и всеми остальными значительно больше в Supercar, где Gigabyte Aorus опережает Radeon VII на 1,59x. 5700 XT здесь немного быстрее, чем Radeon VII.

Здесь не так уж много сюрпризов или расстройств. Radeon VII с легкостью выигрывает оба этих под-теста.

CompuBench предпочитает Radeon VII в целом, но есть определенные тесты, где RTX 2080 одерживает победу, как подразделение Catmull-Clark. 5700 XT может потребовать определенных оптимизаций для своей архитектуры; в целом он соответствует Vega 64, но не так быстр в тесте TV-L1 и вообще не может запускать тесты n-body. Radeon VII в 1,14x1,58x быстрее, чем Vega 64, в зависимости от теста.

Первые три теста рендеринга - Catia, Creo и Energy - являются решающими победами для Radeon RX 5700 XT, который превосходит Radeon VII во всех трех тестах и также легко опережает RTX 2080. Разрыв между Vega и Radeon VII намного меньше, чем разрыв между 5700 XT и Radeon VII.

Регрессия Radeon VII в SNX-03 необычна, но также и эффективность RDNA. Даже RTX 2080 остался в пыли благодаря новейшей архитектуре графических процессоров AMD. Профессиональные графические приложения любят эту видеокарту. SNX-03 - особый прорыв для AMD RDNA.

Окончательный графический тест SPEC Workstation - это не столько прорыв, сколько избиение общего назначения. Radeon 5700 XT выигрывает только один из трех тестов и с меньшим запасом. Radeon VII демонстрирует эталон showcase-02, в то время как RTX 2080 побеждает в тесте приложений 3dsmax-06. В целом, 5700 XT является поразительно сильным аргументом для себя в профессиональных графических приложениях, выиграв гораздо больше тестов, чем проиграл, особенно за GPU за 400 долларов против карт в диапазоне от 500 до 700 долларов.

Наконец, у нас есть приложения SPEC для вычислений на GPU: Folding At Home, Luxrender и Caffe. FAH не будет работать на 5700 XT, поэтому у нас нет результатов для этого. Radeon VII выигрывает Luxrender, 5700 XT побеждает в тесте SPEC Caffe, а RTX 2080 выигрывает у Folding @ Home.

LuxMark включает в себя три сцены, в различной сложности. Radeon VII доминирует во всех трех тестах, хотя RTX 2080 сражается намного лучше, чем GTX 1080. Radeon RX 5700 XT продолжает бороться с OpenCL, и этот факт будет повторяться чуть позже, когда мы перейдем к SiSoft Sandra. , Производительность варьируется от соответствия Vega 64 до отставания даже от GTX 1080, что, несомненно, ценится за то, что ему позволено что-то выиграть.

Мы использовали тест Blender 1.0beta2 для нашего первого раунда тестирования Blender. Gigabyte Aorus исключен из этих результатов из-за несовместимости. 5700 XT быстрее, чем Vega 64 в 5 из 6 тестов, и побеждает Radeon VII в двух. В этом сценарии GTX 1080 явно неконкурентоспособен, а RTX 2080 не работает.

Наш первый набор тестов Blender 2.80 использует размеры листов по умолчанию, которые эти сцены запрограммированы для использования - 16x16 в Barbershop, 32x32 во всех других случаях. Время рендеринга на GTX 1080 значительно улучшилось по сравнению с автономным тестом, но графические процессоры GCN сильно пострадали в Barbershop_Interior и оказали негативное влияние на два других теста. RTX 2080 имеет сильные лидерские позиции в этом тесте при небольшом размере плитки.

Увеличение размера плитки до 512x512 значительно улучшает результаты GCN и RDNA. В то время как 5700 XT не получает такого улучшения от Barbershop_Interior, как Vega 64 и Radeon VII, он демонстрирует наиболее стабильное улучшение во всех тестах. GPU Nvidia, напротив, ухудшаются в каждой сцене, кроме Barbershop_Interior. Значение по умолчанию для Barbershop_Interior 16x16 слишком низкое. RDNA выигрывает два теста (Barbershop, Koro), GCN выигрывает один (Pavilion_Barcelona), а Тьюринг получает BMW27 и Fishy_Cat.

Выводы

Что эти результаты говорят нам? Много довольно интересных вещей. Прежде всего, РДНК совершенно впечатляет. Помните, что мы протестировали этот графический процессор в профессиональных и вычислительно-ориентированных приложениях, ни одно из которых не было обновлено или исправлено для запуска на нем. Есть явные признаки того, что это повлияло на наши результаты тестов, включая некоторые тесты, которые либо не запускались, либо выполнялись медленно. Несмотря на это, 5700 XT впечатляет.

Radeon VII тоже впечатляет, но не так, как 5700 XT. SiSoft Sandra 2020 демонстрирует преимущество, которое эта карта может принести для рабочих нагрузок с двойной точностью, где она обеспечивает гораздо большую производительность, чем что-либо еще на рынке. В последнее время ИИ и машинное обучение стали намного важнее, но если вы работаете в области, где двойная точность GPU является ключевой, Radeon VII обладает огромной огневой мощью. SiSoft Sandra включает тесты, основанные на D3D11, а не на OpenCL. Но учитывая, что OpenCL является главным конкурентом CUDA, я решил придерживаться его во всех случаях, за исключением тестов на задержку памяти, которые в глобальном масштабе показали меньшие задержки для всех графических процессоров при использовании D3D по сравнению с OpenCL.

Ранее AMD заявляла, что намеревается сохранить GCN на рынке для вычислений, поскольку Navi ориентирована на потребительский рынок, но нет никаких признаков того, что фирма намерена продолжать развивать GCN на отдельной траектории от RDNA. Скорее всего, это означает, что GCN не будет заменен на вершине рынка вычислений до тех пор, пока Big Navi не будет готов в какой-то момент в 2020 году. Исходя из того, что мы увидели, на этом фронте есть что взволновать. , Уже есть приложения, в которых RDNA значительно быстрее, чем Radeon VII, несмотря на огромную разницу между картами с точки зрения возможности двойной точности, пропускной способности ОЗУ и объема памяти.

Blender 2.80 представляет интересную серию сравнений между РДНК, GCN и CUDA. Использование больших размеров листов оказывает огромное влияние на производительность графического процессора, но будет ли это различие хорошим или плохим, зависит от того, какую марку графического процессора вы используете и к какому архитектурному семейству оно принадлежит. Графические процессоры Pascal и Turing работают лучше при меньших размерах плитки, в то время как графические процессоры GCN работают лучше с большими. Размер тайла 512 × 512 был лучше в целом для всех графических процессоров, но только потому, что он улучшил общее время рендеринга на Barbershop_Interior более, чем повредил время рендеринга любой другой сцены для графических процессоров Тьюринга и Паскаля. RTX 2080 был самым быстрым графическим процессором в наших тестах Blender, но 5700 XT показал отличные результаты в целом.

Я не хочу делать глобальные заявления о настройках Blender 2.80; Я не эксперт по 3D рендерингу. Эти результаты испытаний показывают, что Blender работает лучше с большими настройками плитки на графических процессорах AMD, но что меньшие настройки плитки могут дать лучшие результаты для графических процессоров Nvidia. В прошлом как графические процессоры AMD, так и Nvidia извлекали выгоду из больших размеров тайлов. Однако этот шаблон также может быть связан с конкретными сценами, о которых идет речь. Если вы запускаете Blender, я предлагаю поэкспериментировать с различными сценами и размерами плиток.

В конечном итоге эти результаты показывают, что на некоторых из этих профессиональных рынков производительность графических процессоров значительно больше, чем мы можем ожидать от игр. Существуют специальные тесты, в которых 5700 XT заметно быстрее, чем RTX 2080 или Radeon VII, и другие тесты, где он резко отстает от них. Незрелость драйвера OpenCL может объяснить некоторые из них, но мы видим вспышки яркости в этих показателях производительности. Производительность Radeon VII с двойной точностью в некоторых отношениях ставит его в отдельный класс, но Radeon RX 5700 XT - гораздо более дешевая и тихая карта. В зависимости от того, какое у вас целевое приложение, новый графический процессор AMD может стать лучшим выбором на рынке. В других сценариях и Radeon VII, и RTX 2080 предъявляют особые и особые требования к тому, чтобы быть самой быстрой из доступных карт.

Особенность изображения - это финальная визуализация сцены Benchmark_Pavilion, включенной в автономный бенчмарк Blender 1.02beta.

Читать далее

Обзор Ryzen 9 5950X и 5900X: AMD демонстрирует Zen 3 против последних бастионов производительности Intel

AMD продолжает натиск на то, что когда-то было бесспорным дерн Intel.

Pfizer заявляет, что новая вакцина против COVID-19 эффективна на 90%

В Соединенных Штатах и во всем мире разрабатывается ряд вакцин против COVID-19, и одна из них показала весьма положительные предварительные результаты в фазе 3 испытаний. Одна конкретная вакцина, разработанная Pfizer и немецкой фирмой BioNTech, по-видимому, более чем на 90 процентов эффективна в предотвращении симптоматических…

Утечка тестов рисует противоречивую картину ракетного озера Intel

Слухи о Rocket Lake в последнее время указывают на два противоположных направления, но более конкурентоспособные цифры, скорее всего, будут правдой.

4K против UHD: в чем разница?

Термины UHD и 4K стали настолько похожи друг на друга, что производители телевизоров, вещательные компании и технические блоги используют их как синонимы - но это не одно и то же.