RTX 2080 проти Radeon VII проти 5700 XT: Візуалізація та обчислення пр

Більшість наших покриттів GPU зосереджена на споживчому бізнесі та на ігровому порівнянні, але я пообіцяв вивчити обчислювальну ефективність роботи, коли Radeon VII запустився. Нещодавно дебютував 5700 XT, ми мали можливість повернутися до цього питання з новою архітектурою GPU від AMD і порівняти RDNA з GCN.

Насправді загальна обчислювальна ситуація знаходиться на цікавому перехресті. AMD заявила, що бажає бути більш серйозним гравцем у корпоративних обчислювальних середовищах, але також заявила, що GCN буде продовжувати існувати поряд з RDNA у цьому просторі. Radeon VII є споживчим варіантом прискорювача MI50 для AMD з підтримкою напівшвидкісного FP64. Якщо ви знаєте, що вам потрібні обчислення FP64 з подвоєною точністю, наприклад, Radeon VII заповнює цю нішу таким чином, як жоден інший GPU у цьому порівнянні не робить.

Radeon VII має найвищу пропускну здатність оперативної пам’яті, і це єдиний GPU в цьому порівнянні, який пропонує багато чого в порівнянні з подвійною точністю. Але хоча ці графічні процесори мають порівняно схожі характеристики на папері, між ними є значна різниця в плані продуктивності - і цифри не завжди розбиваються так, як ви думаєте.

Щодо Blender 2.80

Наші результати тестів містять дані як Blender 2.80, так і окремого бенчмарка Blender, 1.0beta2 (опубліковано в серпні 2018 року). Blender 2.80 є основним випуском програми, і він містить низку суттєвих змін. Автономний бенчмарк не сумісний з RTX сімейством Nvidia, що вимагало тестування на останній версії програмного забезпечення. Спочатку ми тестували бета-версію Blender 2.80, але потім остаточна версія знизилася - тому ми скинули результати бета-версії та повторно перевірили.

Існують значні відмінності між показниками Blender 1.0beta2 та 2.80, а одна сцена, Classroom, не відображається належним чином у новій версії. Ця сцена випала з наших порівнянь 2,80. Blender дозволяє користувачеві задавати розмір плитки в пікселях, щоб контролювати кількість сцени, яка працює над одночасно. Код у файлах Python бенчмарка Bbender 1.0beta2 вказує на те, що для тесту використовується розмір плитки 512 × 512 (координати X / Y) для графічних процесорів та 16 × 16 для процесорів. Більшість файлів сцен, які фактично містяться у еталоні, однак фактично використовують розмір плитки 32 × 32 за замовчуванням, якщо він завантажений у Blender 2.80.

Ми протестували Blender 2.80 в двох різних режимах. По-перше, ми протестували всі сумісні сцени, використовуючи типовий розмір плиток за замовчуванням. Це було 16 × 16 для Barbershop_Interior, а 32 × 32 для всіх інших сцен. Далі ми протестували ті ж рендери з типовим розміром плитки 512 × 512. До цих пір правилом розміру плитки було те, що більші розміри були хорошими для графічних процесорів, а менші розміри - для процесорів. Здається, що Blender 2.80 дещо змінився. Процесори AMD і Nvidia демонструють дуже різні реакції на більші розміри плиток, при цьому графічні процесори AMD прискорюються з більшими розмірами плиток, а графічні процесори Nvidia втрачають продуктивність.

Оскільки файли сцен, які ми тестуємо, були створені в старій версії Blender, можливо, це може вплинути на наші загальні результати. Протягом кількох тижнів ми активно працювали з AMD, щоб вивчити аспекти роботи Blender на графічних процесорах GCN. GCN, Pascal, Turing і RDNA демонструють різну схему результатів при переході від 32 × 32 до 512 × 512, при цьому Тьюрінг втрачає меншу продуктивність, ніж Pascal і RDNA, які отримують більшу ефективність у більшості обставин, ніж GCN.

Усі наші GPU значно виграли від того, що не використовували плитку розміром 16 × 16 для Barbershop_Interior. Хоча цей тестовий показник за замовчуванням до 16 × 16, він не дуже добре відображає розмір плитки на будь-якому GPU.

Усунення несправностей з різними результатами, які ми бачили в еталоні Blender 1.0Beta2 порівняно з бета-версією Blender 2.80 і, нарешті, у фіналі Blender 2.80 тривав цей огляд протягом декількох тижнів, і ми працювали над декількома драйверами AMD, працюючи над ним. Тому всі наші результати Blender 2.80 були запущені за допомогою Adrenaline 2019 Edition 19.8.1.

Налаштування тесту та примітки

Усі графічні процесори були протестовані на системі Intel Core i7-8086K за допомогою материнської плати Asus Prime Z370-A. Усі Vega 64, Radeon RX 5700 XT та Radeon VII були протестовані за допомогою Adrenalin 2019 Edition 19.7.2 (16.07.2019) для всього, крім Blender 2.80. Всі тести на Blender 2.80 виконували з використанням 19.8.1, а не 19.7.2. Як Nvidia GeForce GTX 1080, так і Gigabyte Aorus RTX 2080 тестувались за допомогою драйвера готової драйвери Nvidia 431.60 (23.07.2019).

CompuBench 2.0 запускає GPU через ряд тестів, призначених для вимірювання різних аспектів їх обчислювальної роботи. Однак, Kishonti, розробники CompuBench, не пропонують суттєвої розбивки щодо того, як вони створили свої тести. Моделювання набору рівнів може стосуватися використання наборів рівнів для аналізу поверхонь та форм. Catmull-Clark Subdivision - це техніка, що використовується для створення гладких поверхонь. Моделювання N-тіла - це моделювання динамічних систем частинок під впливом таких сил, як гравітація. Оптичний потік TV-L1 - це реалізація методу оцінки оптичного потоку, який використовується в комп'ютерному зорі.

SPEC Workstation 3.1 містить багато таких самих навантажень, що і SPECViewPerf, але також має додаткові обчислювальні навантаження GPU, які ми розбиваємо окремо. Повний випуск тесту робочої станції та його набору можна знайти тут. SPEC Workstation 3.1 запускався в рідному тестовому режимі 4K. Хоча цей тестовий цикл не був поданий до SPEC для офіційного опублікування, наше тестування SPEC Workstation 3.1 підкорялося заявленим організацією правилам тестування, які можна знайти тут.

Ми підготували для вас два набори результатів - синтетичну серію орієнтирів, створену за допомогою SiSoft Sandra та досліджуючи різні аспекти порівняння цих мікросхем, включаючи потужність обробки, затримку пам’яті та внутрішні характеристики, а також більш широкий набір тестів, які торкніться обчислення та рендерингу в різних додатках Оскільки тести SiSoft Sandra 2020 всі унікальні для цієї програми, ми вирішили вивести їх на власне слайд-шоу.

Результати Gigabyte Aorus RTX 2080 слід читати як приблизно еквівалентні RTX 2070S. Два GPU працюють майже однаково у споживчих робочих навантаженнях і повинні відповідати один одному на робочій станції.

SiSoft Sandra 2020

SiSoft Sandra - це інформаційна утиліта загального призначення та повнофункціональний набір для оцінки продуктивності. Хоча це синтетичний тест, це, мабуть, найбільш повнофункціональна утиліта для синтетичного оцінювання, і Адріан Сіласі, його розробник, десятиліттями витрачав вдосконалення та вдосконалення, додаючи нові функції та тести в міру розвитку процесорів та графічних процесорів.

Наші результати щодо SiSoft Sandra наведені нижче. Деякі наші результати OpenCL трохи дивні, що стосується 5700 XT, але, за словами Адріана, він ще не мав можливості оптимізувати код для виконання на 5700 XT. Вважайте ці результати попередніми - цікавими, але, можливо, ще не показовими - що стосується цього GPU.

Загальний цільовий тест обчислень GPGPU Sandra вимірює ефективність у кількох показниках; ми вирішили зосередитись на напівточності, одноточності та подвійній точності роботи з плаваючою комою. Radeon VII пропонує набагато більшу підтримку плаваючої точки з подвійною точністю, що відображається в його набагато більшій кількості тестів. RTX 2080 виграє цей тест, наскільки продуктивність FPU з напівточністю, пов'язана в одній точності і не відрізняється від DP.

У цьому тесті RX 5700 XT провалився під час запуску з OpenCL. Величезна пропускна здатність пам'яті Radeon VII дає їй перевагу над RTX 2080 у всіх тестових режимах, в той час як Vega 64 пропонує конкурентне шифрування / дешифрування та криптографічну продуктивність, але відстає від RTX 2080 у хешируемом навантаженні.

Ми розбили тест Блек-Шоулз з інших оцінок фінансової моделі, оскільки відмінності в ефективності були занадто великими, щоб правильно скласти графік. Тест OpenCL з низькою точністю значною мірою сприяв Radeon VII, тоді як 5700 XT і RTX 2080 рівномірно відповідали. Високоточна продуктивність Vega 64 значно краща, ніж у 5700 XT, але знову ж таки оптимізація може зіграти головну роль. Чим менше сказано про GTX 1080, тим краще.

Для наукового аналізу ми зосередилися на загальному множенні матриць. Показники ефективності тут, як правило, відповідають результатам, які ми каталогізували в попередніх тестах.

Тест обробки зображень Сандри показує, що Radeon VII лідирує за всіма іншими картами, хоча Vega 64 тут добре працює. Низька продуктивність від Radeon VII може бути пов'язана з оптимізацією OCL.

Як і у процесорів, максимальна корисна смуга пам'яті завжди нижча, ніж максимально теоретична. Версія цього тесту Сандри демонструє нижчі показники, ніж ми могли очікувати, але єдиний справжній сюрприз - це позакласний Vega 64 з 5700 XT.

Ми спочатку перевірили затримку оперативної пам’яті за допомогою OCL / CUDA, але результати не виглядали правильно. У різних типів шаблонів доступу до кешу є дуже різні затримки, але затримка 924ns для повного випадкового вибору на 5700 XT була незвичайною. Затримки оперативної пам’яті не виявляли особливого відношення до моделей продуктивності у Sandra чи інших тестів.

Ми перевірили затримку оперативної пам’яті за допомогою D3D11 замість OpenCL / CUDA, щоб побачити, чи змінить це кінцеві результати. Оцінки GCN та RDNA значно покращилися в цьому API, хоча Radeon 5700 XT все ще дивно набрав.

Наші показники SiSoft Sandra 2020 в основному вказують на той самий напрямок. Якщо вам потрібна плаваюча точка з подвійною точністю, Radeon VII - це обчислювальне чудовисько. Хоча незрозуміло, скільки покупців потрапляють у цю категорію, є певні місця, такі як обробка зображень та високоточна навантаження, де сяє Radeon VII.

Базований на RDNA Radeon 5700 XT робить менш відокремленим у цих тестах, але ми також контактуємо з Silasi щодо питань, з якими стикалися під час тестування. Покращена підтримка може змінити деякі з цих результатів у наступні місяці.

Результати тесту

Тепер, коли ми звернулися до продуктивності Сандри, перейдемо до решти нашого набору тестів. Наші інші результати включені у слайд-шоу нижче:

IndigoBench - це окремий орієнтир візуалізації, який базується на Indigo Render, об'єктивному, фотореалістичному графічному процесорі та рендері. Продуктивність складається в мільйонах зразків в секунду, продуктивність Core i7-8086K надана для довідки. У першій сцені, Спальня, Radeon RX 5700 XT обіграє Radeon VII та Vega 64, припавши лише до RTX 2080. Розрив між Nvidia та всіма іншими значно більший у Supercar, де Gigabyte Aorus веде Radeon VII на 1,59x. 5700 XT трохи швидший, ніж у Radeon VII також.

Тут не надто багато сюрпризів чи розладів. Radeon VII з легкістю виграє обидва ці тести.

CompuBench надає перевагу Radeon VII в цілому, але є специфічні тести, де RTX 2080 здобуває перемогу, як і підрозділ Catmull-Clark. 5700 XT може потребувати конкретних оптимізацій для своєї архітектури; він, як правило, відповідає Vega 64, але майже не такий швидкий у тесті TV-L1 і взагалі не міг проводити тести n-body. В залежності від тесту, Radeon VII знаходиться на 1,14х і 1,58х швидше, ніж Vega 64.

Перші три тести на рендерінг - Катія, Крео та Енергія - вирішили виграти для Radeon RX 5700 XT, який перемагає Radeon VII у всіх трьох тестах і зручно перевершує RTX 2080. Розрив між Vega і Radeon VII набагато менший, ніж розрив між 5700 XT і Radeon VII.

Регресія Radeon VII в SNX-03 незвичайна, але це і продуктивність RDNA. Навіть RTX 2080 залишається в пилу найновішою архітектурою AMD. Здається, професійні програми GPU люблять цю відеокарту. SNX-03 - це особливий вибух для RDNA AMD.

Останній графічний тест SPEC Workstation - це менш вибух і більше побиття загального призначення. Radeon 5700 XT виграє лише один з трьох тестів і з меншими запасами. Radeon VII приймає домашній показник showcase-02, тоді як RTX 2080 перемагає у тесті додатків 3dsmax-06. В цілому, 5700 XT дає надзвичайно сильний аргумент для себе в професійних графічних програмах, виграючи набагато більше тестів, ніж програє, особливо для графічного процесора на $ 400 проти карт у діапазоні $ 500 - $ 700.

Нарешті, у нас є програми для обчислення GPU SPEC: Folding At Home, Luxrender і Caffe. FAH не працює на 5700 XT, тому ми не маємо результатів для цього. Radeon VII виграє Luxrender, 5700 XT виграє показник SPEC у Caffe, а RTX 2080 отримує перемогу в складі Folding @ Home.

LuxMark включає три сцени при різній складності. Radeon VII домінує над усіма трьома орієнтирами, хоча RTX 2080 веде набагато кращу боротьбу, ніж GTX 1080. Radeon RX 5700 XT продовжує боротися з OpenCL, факт, який ми побачимо, повторимося трохи, коли ми переходимо до SiSoft Sandra . Продуктивність коливається від відповідності Vega 64 до відставання навіть GTX 1080, що, безсумнівно, цінує, що можна щось виграти.

Ми використовували орієнтир Blender 1.0beta2 для першого раунду тестування на Blender. Гіробайтний аор у цих результатах опущений через несумісність. 5700 XT швидше, ніж Vega 64 у 5 з 6 тестів і перемагає Radeon VII у двох. У цьому сценарії GTX 1080 абсолютно неконкурентоспроможний, а RTX 2080 не працює.

У нашому першому наборі тестів Blender 2,80 використовуються типові розміри плиток, які ці сцени запрограмовані для використання - 16x16 в Barbershop, 32x32 у всіх інших випадках. Час візуалізації значно покращився на GTX 1080 порівняно з автономним тестом, проте графічні процесори GCN зазнають значного удару в Barbershop_Interior і негативно впливають на два інші тести. RTX 2080 займає сильну лідерську позицію в цьому тесті при низькому розмірі плитки.

Збільшення розміру плитки до 512x512 значно покращує результати GCN та RDNA. У той час як 5700 XT не отримає такого покращення від Barbershop_Interior, як Vega 64 і Radeon VII, він показує найбільш послідовне поліпшення в усіх тестах. Навпаки, графічні процесори Nvidia погіршуються в кожній сцені, окрім Barbershop_Interior. За замовчуванням Barbershop_Interior 16x16 просто занадто низький. RDNA виграє два тести (Barbershop, Koro), GCN виграє один (Pavilion_Barcelona), а Тьюрінг приймає BMW27 та Fishy_Cat.

Висновки

Про що нам говорять ці результати? Дуже багато цікавих речей. Перш за все, RDNA прямо вражає. Майте на увазі, що ми протестували цей графічний процесор у професійних та орієнтованих на обчисленні додатках, жодне з яких не оновлено та не зафіксовано для роботи на ньому. Існують чіткі ознаки того, що це вплинуло на результати порівняння, включаючи деякі тести, які або не запускалися, або протікали повільно. Тим не менш, 5700 XT вражає.

Radeon VII теж вражає, але по-різному, ніж 5700 XT. SiSoft Sandra 2020 демонструє перевагу, яку ця карта може принести в роботі з подвоєною точністю роботи, де вона пропонує набагато більшу продуктивність, ніж будь-що інше на ринку. AI та машинне навчання стали набагато важливішими з пізнього часу, але якщо ви працюєте в області, в якій подвійна точність GPU є ключовою, Radeon VII має велику кількість вогневої сили. SiSoft Sandra включає тести, які покладаються на D3D11, а не на OpenCL. Але, враховуючи, що OpenCL є головним конкурентом CUDA, я вирішив дотримуватися цього у всіх випадках, крім тестів на затримку пам’яті, які в глобальному масштабі показали менші затримки для всіх графічних процесорів, коли D3D використовувався порівняно з OpenCL.

Раніше AMD заявляв, що має намір утримати GCN на ринку для обчислень, орієнтуючись на споживчий ринок, але немає жодних ознак того, що фірма має намір продовжувати розвивати GCN на окремій траєкторії від RDNA. Більш імовірний сенс цього полягає в тому, що GCN не буде замінено на вершині ринку обчислень, поки Big Navi не буде готова в якийсь момент в 2020 році. Виходячи з того, що ми бачили, на цьому фронті можна багато чого радіти . Вже є додатки, де RDNA значно швидша, ніж Radeon VII, незважаючи на велику різницю між картами з точки зору подвійної точності, пропускної здатності оперативної пам’яті та ємності пам’яті.

Blender 2.80 представляє цікаву серію порівнянь між RDNA, GCN та CUDA. Використання більш високих розмірів плиток має величезний вплив на продуктивність графічного процесора, але чи є різниця хорошою чи поганою, залежить від того, яку марку GPU ви використовуєте та до якої архітектурної родини вона належить. Паскаль і Тьюрінг графічні процесори краще з меншими розмірами плиток, тоді як графічні процесори GCN краще з більшими. Розмір плитки 512 × 512 в цілому був кращим для всіх графічних процесорів, але лише тому, що він покращив загальний час візуалізації на Barbershop_Interior більш ніж, ніж це завдало шкоди часу візуалізації будь-якої іншої сцени для Turing та Pascal GPU. RTX 2080 був найшвидшим графічним процесором у наших показниках Blender, але 5700 XT загалом показав чудові результати.

Я не хочу робити глобальних вимов щодо налаштувань Blender 2.80; Я не є експертом з 3D-рендерінгу. Ці результати тестування дозволяють припустити, що Blender краще працює з більшими налаштуваннями плиток на графічних процесорах AMD, але менші налаштування плитки можуть давати кращі результати для графічних процесорів Nvidia. Раніше і більші розміри плиток отримували користь як для процесорів AMD, так і для Nvidia. Однак ця модель також може бути пов'язана з конкретними сценами. Якщо ви використовуєте Blender, я пропоную експериментувати з різними розмірами сцен і розмірами плитки.

Зрештою, те, що свідчать ці результати, - це те, що в деяких професійних ринках є більше варіацій в роботі графічного процесора, ніж ми могли б очікувати на ігри. Існують специфічні тести, де 5700 XT помітно швидше, ніж RTX 2080 або Radeon VII, та інші тести, коли він сильно відстає від них. Деякі з цього можуть спричинити незрілість драйверів OpenCL, але на цих показниках продуктивності ми бачимо спалахи блиску. Продуктивність подвійної точності Radeon VII певним чином ставила її до свого класу, але Radeon RX 5700 XT - набагато менш дорога і тиха карта. Залежно від того, яка ваша цільова програма, новий графічний процесор AMD на $ 400 може бути найкращим вибором на ринку. В інших сценаріях, і Radeon VII, і RTX 2080 заявляють, що це найшвидша карта, яка є найшвидшою.

Образне зображення - це остаточне відображення сцени Benchmark_Pavilion, включеної в окремий показник Blender 1,02beta.