RTX 2080 против Radeon VII против 5700 XT: производительность рендерин

RTX 2080 против Radeon VII против 5700 XT: производительность рендерин

Большая часть нашего охвата GPU сфокусирована на потребительской стороне бизнеса и на тестировании игр, но я обещал изучить вычислительную сторону производительности еще во время запуска Radeon VII. С 5700 XT, недавно дебютировавшим, у нас была возможность вернуться к этому вопросу с новой архитектурой GPU от AMD и сравнить RDNA с GCN.

На самом деле, общая вычислительная ситуация находится на интересном перекрестке. AMD заявила, что хочет быть более серьезным игроком в корпоративных вычислительных средах, но также заявила, что GCN будет продолжать существовать вместе с RDNA в этом пространстве. Radeon VII - это потребительский вариант ускорителя AMD MI50 с поддержкой полускоростной FP64. Если вы знаете, что вам нужно вычисление FP64 с двойной точностью, например, Radeon VII заполняет эту нишу так, как никакой другой графический процессор в этом сравнении не делает.

RTX 2080 против Radeon VII против 5700 XT: производительность рендерин

Radeon VII обладает самой высокой пропускной способностью ОЗУ и является единственным графическим процессором в этом сравнении, обеспечивающим высокую производительность с двойной точностью. Но хотя эти графические процессоры имеют относительно схожие бумажные характеристики, между ними существует существенное расхождение с точки зрения производительности - и цифры не всегда нарушают то, что вы думаете.

Относительно Blender 2.80

Результаты нашего теста содержат данные как от Blender 2.80, так и от отдельного бенчмарка Blender 1.0beta2 (выпущен в августе 2018 года). Blender 2.80 является основным выпуском приложения и содержит ряд значительных изменений. Автономный тест не совместим с семейством RTX от Nvidia, что требовало тестирования с использованием последней версии программного обеспечения. Первоначально мы тестировали бета-версию Blender 2.80, но затем окончательная версия упала, поэтому мы сбросили результаты бета-тестирования и провели повторную проверку.

Изображение Блендер
Изображение Блендер

Существуют значительные различия в производительности между тестом Blender 1.0beta2 и 2.80, и одна сцена, Classroom, не отображается должным образом в новой версии. Эта сцена была исключена из наших 2.80 сравнений. Blender позволяет пользователю указывать размер плитки в пикселях, чтобы контролировать, сколько сцены обрабатывается одновременно. Код в файлах Python бенчмарка Blender 1.0beta2 указывает, что в тесте используется размер мозаичного фрагмента 512 × 512 (координаты X / Y) для графических процессоров и 16 × 16 для процессорных. Однако большинство файлов сцен, фактически содержащихся в бенчмарке, по умолчанию используют размер плитки 32 × 32, если они загружены в Blender 2.80.

Мы тестировали Blender 2.80 в двух разных режимах. Сначала мы протестировали все совместимые сцены, используя размер мозаики по умолчанию, в который загружены эти сцены. Это было 16 × 16 для Barbershop_Interior и 32 × 32 для всех других сцен. Затем мы протестировали те же рендеры с размером плитки по умолчанию 512 × 512. До сих пор правило с размерами листов было то, что большие размеры были хороши для графических процессоров, в то время как меньшие размеры были хороши для процессоров. Похоже, что это немного изменилось с Blender 2.80. Графические процессоры AMD и Nvidia демонстрируют очень разные отклики на большие размеры плиток: графические процессоры AMD ускоряются при увеличении размеров плиток и графические процессоры Nvidia теряют производительность.

Поскольку файлы сцен, которые мы тестируем, были созданы в более старой версии Blender, возможно, это повлияет на наши общие результаты. В течение нескольких недель мы интенсивно работали с AMD, чтобы изучить аспекты производительности Blender на графических процессорах GCN. GCN, Паскаль, Тьюринг и РДНК демонстрируют различную структуру результатов при переходе с 32 × 32 на 512 × 512, при этом Тьюринг теряет меньшую производительность, чем Паскаль и РДНК, и в большинстве случаев получает большую производительность, чем GCN.

Все наши графические процессоры значительно выиграли от того, что не использовали размер плитки 16 × 16 для Barbershop_Interior. Хотя этот тест по умолчанию равен 16 × 16, он не очень хорошо рендерится при таком размере тайла на любом графическом процессоре.

Устранение различных результатов, которые мы увидели в бенчмарке Blender 1.0Beta2 по сравнению с бета-версией Blender 2.80 и, наконец, финалом Blender 2.80 задержал этот обзор в течение нескольких недель, и во время работы над ним мы обменялись несколькими драйверами AMD. Поэтому все результаты Blender 2.80 были выполнены с использованием Adrenaline 2019 Edition 19.8.1.

Настройка теста и примечания

Все графические процессоры были протестированы на системе Intel Core i7-8086K с использованием материнской платы Asus Prime Z370-A. Vega 64, Radeon RX 5700 XT и Radeon VII были протестированы с использованием Adrenalin 2019 Edition 19.7.2 (16.07.2009) для всего, кроме Blender 2.80. Все тесты Blender 2.80 были выполнены с использованием 19.8.1, а не 19.7.2. Nvidia GeForce GTX 1080 и Gigabyte Aorus RTX 2080 были протестированы с использованием драйвера Nvidia 431.60 Game Ready (23.07.2009).

CompuBench 2.0 проводит графические процессоры через серию тестов, предназначенных для измерения различных аспектов их вычислительной производительности. Однако разработчики CompuBench Кишонти, похоже, не предлагают какой-либо существенной разбивки того, как они разработали свои тесты. Моделирование набора уровней может относиться к использованию наборов уровней для анализа поверхностей и форм. Подразделение Catmull-Clark - это техника, используемая для создания гладких поверхностей. Моделирование N-тела - это моделирование динамических систем частиц под действием таких сил, как гравитация. Оптический поток TV-L1 - это реализация метода оценки оптического потока, используемого в компьютерном зрении.

SPEC Workstation 3.1 содержит много тех же самых рабочих нагрузок, что и SPECViewPerf, но также имеет дополнительные вычислительные рабочие нагрузки на GPU, которые мы разберем отдельно. Полное описание теста рабочей станции и его набора приложений можно найти здесь. Рабочая станция SPEC 3.1 была запущена в собственном тестовом режиме 4K. Хотя этот тестовый прогон не был представлен в SPEC для официальной публикации, наше тестирование рабочей станции SPEC 3.1 подчинялось установленным в организации правилам тестирования, которые можно найти здесь.

Мы подготовили для вас два набора результатов - синтетическую серию тестов, созданных с помощью SiSoft Sandra, и исследуют различные аспекты сравнения этих чипов, включая вычислительную мощность, задержку памяти и внутренние характеристики, а также более широкий набор тестов, которые касаться производительности вычислений и рендеринга в различных приложениях Поскольку тесты SiSoft Sandra 2020 являются уникальными для этого приложения, мы решили разбить их на собственное слайд-шоу.

Результаты Gigabyte Aorus RTX 2080 следует считать приблизительно эквивалентными RTX 2070S. Два графических процессора работают почти одинаково в рабочих нагрузках потребителя и должны соответствовать друг другу на рабочей станции.

SiSoft Sandra 2020

SiSoft Sandra - это универсальная служебная информация о системе и полнофункциональный пакет для оценки производительности. Несмотря на то, что это синтетический тест, он, вероятно, является наиболее полнофункциональной утилитой синтетического анализа, и Адриан Силаси, ее разработчик, десятилетиями совершенствовал и улучшал ее, добавляя новые функции и тесты по мере развития процессоров и графических процессоров.

Наши специфические результаты SiSoft Sandra приведены ниже. Некоторые из наших результатов OpenCL немного странны в отношении 5700 XT, но, по словам Адриана, у него еще не было возможности оптимизировать код для выполнения на 5700 XT. Считайте эти результаты предварительными - интересными, но, возможно, еще не показательными - в отношении этого графического процессора.

Наши тесты SiSoft Sandra 2020 указывают в основном на то же направление. Если вам нужна двойная точность с плавающей точкой, Radeon VII - вычислительный монстр. Хотя неясно, сколько покупателей попадает в эту категорию, есть определенные места, такие как обработка изображений и высокоточные рабочие нагрузки, где сияет Radeon VII.

Radeon 5700 XT на основе RDNA делает меньше, чтобы отличиться в этих тестах, но мы также связываемся с Silasi по вопросам, с которыми мы столкнулись во время тестирования. Улучшенная поддержка может изменить некоторые из этих результатов в ближайшие месяцы.

Результаты теста

Теперь, когда мы рассмотрели производительность Sandra, давайте обратимся к остальной части нашего набора тестов. Наши другие результаты включены в слайд-шоу ниже:

Выводы

Что эти результаты говорят нам? Много довольно интересных вещей. Прежде всего, РДНК совершенно впечатляет. Помните, что мы протестировали этот графический процессор в профессиональных и вычислительно-ориентированных приложениях, ни одно из которых не было обновлено или исправлено для запуска на нем. Есть явные признаки того, что это повлияло на наши результаты тестов, включая некоторые тесты, которые либо не запускались, либо выполнялись медленно. Несмотря на это, 5700 XT впечатляет.

Radeon VII тоже впечатляет, но не так, как 5700 XT. SiSoft Sandra 2020 демонстрирует преимущество, которое эта карта может принести для рабочих нагрузок с двойной точностью, где она обеспечивает гораздо большую производительность, чем что-либо еще на рынке. В последнее время ИИ и машинное обучение стали намного важнее, но если вы работаете в области, где двойная точность GPU является ключевой, Radeon VII обладает огромной огневой мощью. SiSoft Sandra включает тесты, основанные на D3D11, а не на OpenCL. Но учитывая, что OpenCL является главным конкурентом CUDA, я решил придерживаться его во всех случаях, за исключением тестов на задержку памяти, которые в глобальном масштабе показали меньшие задержки для всех графических процессоров при использовании D3D по сравнению с OpenCL.

Ранее AMD заявляла, что намеревается сохранить GCN на рынке для вычислений, поскольку Navi ориентирована на потребительский рынок, но нет никаких признаков того, что фирма намерена продолжать развивать GCN на отдельной траектории от RDNA. Скорее всего, это означает, что GCN не будет заменен на вершине рынка вычислений до тех пор, пока Big Navi не будет готов в какой-то момент в 2020 году. Исходя из того, что мы увидели, на этом фронте есть что взволновать. , Уже есть приложения, в которых RDNA значительно быстрее, чем Radeon VII, несмотря на огромную разницу между картами с точки зрения возможности двойной точности, пропускной способности ОЗУ и объема памяти.

Blender 2.80 представляет интересную серию сравнений между РДНК, GCN и CUDA. Использование больших размеров листов оказывает огромное влияние на производительность графического процессора, но будет ли это различие хорошим или плохим, зависит от того, какую марку графического процессора вы используете и к какому архитектурному семейству оно принадлежит. Графические процессоры Pascal и Turing работают лучше при меньших размерах плитки, в то время как графические процессоры GCN работают лучше с большими. Размер тайла 512 × 512 был лучше в целом для всех графических процессоров, но только потому, что он улучшил общее время рендеринга на Barbershop_Interior более, чем повредил время рендеринга любой другой сцены для графических процессоров Тьюринга и Паскаля. RTX 2080 был самым быстрым графическим процессором в наших тестах Blender, но 5700 XT показал отличные результаты в целом.

Я не хочу делать глобальные заявления о настройках Blender 2.80; Я не эксперт по 3D рендерингу. Эти результаты испытаний показывают, что Blender работает лучше с большими настройками плитки на графических процессорах AMD, но что меньшие настройки плитки могут дать лучшие результаты для графических процессоров Nvidia. В прошлом как графические процессоры AMD, так и Nvidia извлекали выгоду из больших размеров тайлов. Однако этот шаблон также может быть связан с конкретными сценами, о которых идет речь. Если вы запускаете Blender, я предлагаю поэкспериментировать с различными сценами и размерами плиток.

В конечном итоге эти результаты показывают, что на некоторых из этих профессиональных рынков производительность графических процессоров значительно больше, чем мы можем ожидать от игр. Существуют специальные тесты, в которых 5700 XT заметно быстрее, чем RTX 2080 или Radeon VII, и другие тесты, где он резко отстает от них. Незрелость драйвера OpenCL может объяснить некоторые из них, но мы видим вспышки яркости в этих показателях производительности. Производительность Radeon VII с двойной точностью в некоторых отношениях ставит его в отдельный класс, но Radeon RX 5700 XT - гораздо более дешевая и тихая карта. В зависимости от того, какое у вас целевое приложение, новый графический процессор AMD может стать лучшим выбором на рынке. В других сценариях и Radeon VII, и RTX 2080 предъявляют особые и особые требования к тому, чтобы быть самой быстрой из доступных карт.

Особенность изображения - это финальная визуализация сцены Benchmark_Pavilion, включенной в автономный бенчмарк Blender 1.02beta.

Читать далее

Новая серия AMD Radeon RX 6000 оптимизирована для борьбы с амперами
Новая серия AMD Radeon RX 6000 оптимизирована для борьбы с амперами

AMD представила серию RX 6000 сегодня. Впервые с момента покупки ATI в 2006 году использование графических процессоров AMD на платформах AMD даст определенные преимущества.

Обзор AMD Radeon 6800 XT: Big Navi сражается с RTX 3080
Обзор AMD Radeon 6800 XT: Big Navi сражается с RTX 3080

AMD выпустила свои Radeon RX 6800 и RX 6800 XT. Мы подробно рассмотрим сравнение 6800 XT с Nvidia RTX 3080.

Обзор AMD Radeon RX 6800 XT: Big Navi сражается с RTX 3080
Обзор AMD Radeon RX 6800 XT: Big Navi сражается с RTX 3080

AMD выпустила свои Radeon RX 6800 и RX 6800 XT. Мы подробно рассмотрим сравнение 6800 XT с Nvidia RTX 3080.

Самый большой Navi: AMD запускает Radeon RX 6900 XT по цене 999 долларов
Самый большой Navi: AMD запускает Radeon RX 6900 XT по цене 999 долларов

AMD выпустила RX 6900 XT сегодня по цене 999 долларов - теоретически.