RTX 2080 проти Radeon VII проти 5700 XT: Візуалізація та обчислення пр

RTX 2080 проти Radeon VII проти 5700 XT: Візуалізація та обчислення пр

Більшість наших покриттів GPU зосереджена на споживчому бізнесі та на ігровому порівнянні, але я пообіцяв вивчити обчислювальну ефективність роботи, коли Radeon VII запустився. Нещодавно дебютував 5700 XT, ми мали можливість повернутися до цього питання з новою архітектурою GPU від AMD і порівняти RDNA з GCN.

Насправді загальна обчислювальна ситуація знаходиться на цікавому перехресті. AMD заявила, що бажає бути більш серйозним гравцем у корпоративних обчислювальних середовищах, але також заявила, що GCN буде продовжувати існувати поряд з RDNA у цьому просторі. Radeon VII є споживчим варіантом прискорювача MI50 для AMD з підтримкою напівшвидкісного FP64. Якщо ви знаєте, що вам потрібні обчислення FP64 з подвоєною точністю, наприклад, Radeon VII заповнює цю нішу таким чином, як жоден інший GPU у цьому порівнянні не робить.

RTX 2080 проти Radeon VII проти 5700 XT: Візуалізація та обчислення пр

Radeon VII має найвищу пропускну здатність оперативної пам’яті, і це єдиний GPU в цьому порівнянні, який пропонує багато чого в порівнянні з подвійною точністю. Але хоча ці графічні процесори мають порівняно схожі характеристики на папері, між ними є значна різниця в плані продуктивності - і цифри не завжди розбиваються так, як ви думаєте.

Щодо Blender 2.80

Наші результати тестів містять дані як Blender 2.80, так і окремого бенчмарка Blender, 1.0beta2 (опубліковано в серпні 2018 року). Blender 2.80 є основним випуском програми, і він містить низку суттєвих змін. Автономний бенчмарк не сумісний з RTX сімейством Nvidia, що вимагало тестування на останній версії програмного забезпечення. Спочатку ми тестували бета-версію Blender 2.80, але потім остаточна версія знизилася - тому ми скинули результати бета-версії та повторно перевірили.

Зображення Blender
Зображення Blender

Існують значні відмінності між показниками Blender 1.0beta2 та 2.80, а одна сцена, Classroom, не відображається належним чином у новій версії. Ця сцена випала з наших порівнянь 2,80. Blender дозволяє користувачеві задавати розмір плитки в пікселях, щоб контролювати кількість сцени, яка працює над одночасно. Код у файлах Python бенчмарка Bbender 1.0beta2 вказує на те, що для тесту використовується розмір плитки 512 × 512 (координати X / Y) для графічних процесорів та 16 × 16 для процесорів. Більшість файлів сцен, які фактично містяться у еталоні, однак фактично використовують розмір плитки 32 × 32 за замовчуванням, якщо він завантажений у Blender 2.80.

Ми протестували Blender 2.80 в двох різних режимах. По-перше, ми протестували всі сумісні сцени, використовуючи типовий розмір плиток за замовчуванням. Це було 16 × 16 для Barbershop_Interior, а 32 × 32 для всіх інших сцен. Далі ми протестували ті ж рендери з типовим розміром плитки 512 × 512. До цих пір правилом розміру плитки було те, що більші розміри були хорошими для графічних процесорів, а менші розміри - для процесорів. Здається, що Blender 2.80 дещо змінився. Процесори AMD і Nvidia демонструють дуже різні реакції на більші розміри плиток, при цьому графічні процесори AMD прискорюються з більшими розмірами плиток, а графічні процесори Nvidia втрачають продуктивність.

Оскільки файли сцен, які ми тестуємо, були створені в старій версії Blender, можливо, це може вплинути на наші загальні результати. Протягом кількох тижнів ми активно працювали з AMD, щоб вивчити аспекти роботи Blender на графічних процесорах GCN. GCN, Pascal, Turing і RDNA демонструють різну схему результатів при переході від 32 × 32 до 512 × 512, при цьому Тьюрінг втрачає меншу продуктивність, ніж Pascal і RDNA, які отримують більшу ефективність у більшості обставин, ніж GCN.

Усі наші GPU значно виграли від того, що не використовували плитку розміром 16 × 16 для Barbershop_Interior. Хоча цей тестовий показник за замовчуванням до 16 × 16, він не дуже добре відображає розмір плитки на будь-якому GPU.

Усунення несправностей з різними результатами, які ми бачили в еталоні Blender 1.0Beta2 порівняно з бета-версією Blender 2.80 і, нарешті, у фіналі Blender 2.80 тривав цей огляд протягом декількох тижнів, і ми працювали над декількома драйверами AMD, працюючи над ним. Тому всі наші результати Blender 2.80 були запущені за допомогою Adrenaline 2019 Edition 19.8.1.

Налаштування тесту та примітки

Усі графічні процесори були протестовані на системі Intel Core i7-8086K за допомогою материнської плати Asus Prime Z370-A. Усі Vega 64, Radeon RX 5700 XT та Radeon VII були протестовані за допомогою Adrenalin 2019 Edition 19.7.2 (16.07.2019) для всього, крім Blender 2.80. Всі тести на Blender 2.80 виконували з використанням 19.8.1, а не 19.7.2. Як Nvidia GeForce GTX 1080, так і Gigabyte Aorus RTX 2080 тестувались за допомогою драйвера готової драйвери Nvidia 431.60 (23.07.2019).

CompuBench 2.0 запускає GPU через ряд тестів, призначених для вимірювання різних аспектів їх обчислювальної роботи. Однак, Kishonti, розробники CompuBench, не пропонують суттєвої розбивки щодо того, як вони створили свої тести. Моделювання набору рівнів може стосуватися використання наборів рівнів для аналізу поверхонь та форм. Catmull-Clark Subdivision - це техніка, що використовується для створення гладких поверхонь. Моделювання N-тіла - це моделювання динамічних систем частинок під впливом таких сил, як гравітація. Оптичний потік TV-L1 - це реалізація методу оцінки оптичного потоку, який використовується в комп'ютерному зорі.

SPEC Workstation 3.1 містить багато таких самих навантажень, що і SPECViewPerf, але також має додаткові обчислювальні навантаження GPU, які ми розбиваємо окремо. Повний випуск тесту робочої станції та його набору можна знайти тут. SPEC Workstation 3.1 запускався в рідному тестовому режимі 4K. Хоча цей тестовий цикл не був поданий до SPEC для офіційного опублікування, наше тестування SPEC Workstation 3.1 підкорялося заявленим організацією правилам тестування, які можна знайти тут.

Ми підготували для вас два набори результатів - синтетичну серію орієнтирів, створену за допомогою SiSoft Sandra та досліджуючи різні аспекти порівняння цих мікросхем, включаючи потужність обробки, затримку пам’яті та внутрішні характеристики, а також більш широкий набір тестів, які торкніться обчислення та рендерингу в різних додатках Оскільки тести SiSoft Sandra 2020 всі унікальні для цієї програми, ми вирішили вивести їх на власне слайд-шоу.

Результати Gigabyte Aorus RTX 2080 слід читати як приблизно еквівалентні RTX 2070S. Два GPU працюють майже однаково у споживчих робочих навантаженнях і повинні відповідати один одному на робочій станції.

SiSoft Sandra 2020

SiSoft Sandra - це інформаційна утиліта загального призначення та повнофункціональний набір для оцінки продуктивності. Хоча це синтетичний тест, це, мабуть, найбільш повнофункціональна утиліта для синтетичного оцінювання, і Адріан Сіласі, його розробник, десятиліттями витрачав вдосконалення та вдосконалення, додаючи нові функції та тести в міру розвитку процесорів та графічних процесорів.

Наші результати щодо SiSoft Sandra наведені нижче. Деякі наші результати OpenCL трохи дивні, що стосується 5700 XT, але, за словами Адріана, він ще не мав можливості оптимізувати код для виконання на 5700 XT. Вважайте ці результати попередніми - цікавими, але, можливо, ще не показовими - що стосується цього GPU.

Наші показники SiSoft Sandra 2020 в основному вказують на той самий напрямок. Якщо вам потрібна плаваюча точка з подвійною точністю, Radeon VII - це обчислювальне чудовисько. Хоча незрозуміло, скільки покупців потрапляють у цю категорію, є певні місця, такі як обробка зображень та високоточна навантаження, де сяє Radeon VII.

Базований на RDNA Radeon 5700 XT робить менш відокремленим у цих тестах, але ми також контактуємо з Silasi щодо питань, з якими стикалися під час тестування. Покращена підтримка може змінити деякі з цих результатів у наступні місяці.

Результати тесту

Тепер, коли ми звернулися до продуктивності Сандри, перейдемо до решти нашого набору тестів. Наші інші результати включені у слайд-шоу нижче:

Висновки

Про що нам говорять ці результати? Дуже багато цікавих речей. Перш за все, RDNA прямо вражає. Майте на увазі, що ми протестували цей графічний процесор у професійних та орієнтованих на обчисленні додатках, жодне з яких не оновлено та не зафіксовано для роботи на ньому. Існують чіткі ознаки того, що це вплинуло на результати порівняння, включаючи деякі тести, які або не запускалися, або протікали повільно. Тим не менш, 5700 XT вражає.

Radeon VII теж вражає, але по-різному, ніж 5700 XT. SiSoft Sandra 2020 демонструє перевагу, яку ця карта може принести в роботі з подвоєною точністю роботи, де вона пропонує набагато більшу продуктивність, ніж будь-що інше на ринку. AI та машинне навчання стали набагато важливішими з пізнього часу, але якщо ви працюєте в області, в якій подвійна точність GPU є ключовою, Radeon VII має велику кількість вогневої сили. SiSoft Sandra включає тести, які покладаються на D3D11, а не на OpenCL. Але, враховуючи, що OpenCL є головним конкурентом CUDA, я вирішив дотримуватися цього у всіх випадках, крім тестів на затримку пам’яті, які в глобальному масштабі показали менші затримки для всіх графічних процесорів, коли D3D використовувався порівняно з OpenCL.

Раніше AMD заявляв, що має намір утримати GCN на ринку для обчислень, орієнтуючись на споживчий ринок, але немає жодних ознак того, що фірма має намір продовжувати розвивати GCN на окремій траєкторії від RDNA. Більш імовірний сенс цього полягає в тому, що GCN не буде замінено на вершині ринку обчислень, поки Big Navi не буде готова в якийсь момент в 2020 році. Виходячи з того, що ми бачили, на цьому фронті можна багато чого радіти . Вже є додатки, де RDNA значно швидша, ніж Radeon VII, незважаючи на велику різницю між картами з точки зору подвійної точності, пропускної здатності оперативної пам’яті та ємності пам’яті.

Blender 2.80 представляє цікаву серію порівнянь між RDNA, GCN та CUDA. Використання більш високих розмірів плиток має величезний вплив на продуктивність графічного процесора, але чи є різниця хорошою чи поганою, залежить від того, яку марку GPU ви використовуєте та до якої архітектурної родини вона належить. Паскаль і Тьюрінг графічні процесори краще з меншими розмірами плиток, тоді як графічні процесори GCN краще з більшими. Розмір плитки 512 × 512 в цілому був кращим для всіх графічних процесорів, але лише тому, що він покращив загальний час візуалізації на Barbershop_Interior більш ніж, ніж це завдало шкоди часу візуалізації будь-якої іншої сцени для Turing та Pascal GPU. RTX 2080 був найшвидшим графічним процесором у наших показниках Blender, але 5700 XT загалом показав чудові результати.

Я не хочу робити глобальних вимов щодо налаштувань Blender 2.80; Я не є експертом з 3D-рендерінгу. Ці результати тестування дозволяють припустити, що Blender краще працює з більшими налаштуваннями плиток на графічних процесорах AMD, але менші налаштування плитки можуть давати кращі результати для графічних процесорів Nvidia. Раніше і більші розміри плиток отримували користь як для процесорів AMD, так і для Nvidia. Однак ця модель також може бути пов'язана з конкретними сценами. Якщо ви використовуєте Blender, я пропоную експериментувати з різними розмірами сцен і розмірами плитки.

Зрештою, те, що свідчать ці результати, - це те, що в деяких професійних ринках є більше варіацій в роботі графічного процесора, ніж ми могли б очікувати на ігри. Існують специфічні тести, де 5700 XT помітно швидше, ніж RTX 2080 або Radeon VII, та інші тести, коли він сильно відстає від них. Деякі з цього можуть спричинити незрілість драйверів OpenCL, але на цих показниках продуктивності ми бачимо спалахи блиску. Продуктивність подвійної точності Radeon VII певним чином ставила її до свого класу, але Radeon RX 5700 XT - набагато менш дорога і тиха карта. Залежно від того, яка ваша цільова програма, новий графічний процесор AMD на $ 400 може бути найкращим вибором на ринку. В інших сценаріях, і Radeon VII, і RTX 2080 заявляють, що це найшвидша карта, яка є найшвидшою.

Образне зображення - це остаточне відображення сцени Benchmark_Pavilion, включеної в окремий показник Blender 1,02beta.