Від 4.3GHz All-Core оверклокинг SMT скейлінга: всеосяжний огляд AMD Threadripper 3990X

Від 4.3GHz All-Core оверклокинг SMT скейлінга: всеосяжний огляд AMD Threadripper 3990X

AMD провела останні три роки переписує правила продуктивності робочого столу. У п'ятницю виробник мікропроцесор AMD запустила Ryzen Threadripper 3990X, перший в світі односокетних 64-ядерний процесор. Я вже написав тизер для цієї статті і перейшли деякі з моїх ранніх думок на процесорі, але ось де ми покопатися в даних на чіпі і подивитися, що звіти можуть сказати нам.

При правильних обставин Ryzen Threadripper 3990X пропонує неймовірну продуктивність. У неоптимізованими робочих навантажень, це плоскі або навіть зниження проти Ryzen Threadripper 3970X. Я витратив багато часу на введення процесора через його кроки, шукаю сценарії, де вона досягає успіху і аналіз, де вона падає плоскою. Я також кинув його на вулиці в 12-градусний Фаренгейт (-11C) повітрі і розігнав його за допомогою Asus Zenith II Extreme, просто для задоволення. Ми будемо говорити про це, теж. Я, можливо, пропустив світовий рекорд для підприємливого людини з рідким азотом, але CB20 м'ячем я вдарив би по-як і раніше претендувати на цю систему другого місця відповідно до HWBOT.

Я припускаю, що ви знаєте про Threadripper 3990X і прочитали наш огляд 3970X, плюс обговорення 3990X запуск з минулого тижня.

Windows, планувальник потоків

Одне з питань, які зачіпають наші результати для Windows 10 є те, що операційна система не масштабується вище 64 потоків дуже ефективно. Операційна система розщеплює робочі навантаження центрального процесора в процесор груп, до 64 потоків, призначених кожній групі. Деякі додатки надають свої власні планувальник потоків, але додатки, які не часто закривають на ~ 50 відсотків завантаження процесора на 3990X. Linux масштабування, як правило, краще; Rob Williams в Techgage має більше даних з цього питання. додатки рендеринга 3D легко найсильніші споживчі категорії для 3990X, який ставить свої сильні показники масштабування в цих додатках. Там були повідомлення про те, для Windows 10 Enterprise може запропонувати краще масштабування, але наші контакти на AMD показали, що немає ніяких підстав для користувача, щоб запустити Windows 10 Enterprise при покупці 3990X. Офіційне керівництво від AMD є те, що для Windows 10 Pro досить.

(Відсутність) Intel конкуренції

Ми звернулися до Intel, щоб дізнатися, якщо компанія буде надавати серверні Xeon процесорів для порівняння проти 3990X, але компанія вирішила не зразок з процесором AMD. У той час як ці порівняння не вирівняні за ціною, вони б дозволили нам порівнювати топові рішення від обох компаній. Без опції для малювання на Xeon, наше порівняння автомобіль був обмежений Основний i9-10980XE.

В ~ $ 1000, то 10980XE не може вважатися справедливою конкуренцією за $ 4000 3990X, але це ближче Intel CPU ми, і я хотів, щоб дати деяке уявлення про те, як це складено. Оскільки різні додатки мають такі різні відповіді на високій ключових кількості процесорів, існують випадки, коли 10980XE відповідає або перевершує 3990X. Більше ядер не завжди краще, навіть сьогодні.

Результати настройки форматування, тестування

Цей огляд має велику площу, ніж мій типовий охоплення, і я розділив результати на кілька різних категорії. Наш стандартний набір тестів порівнює верхню Threadripper і ядро ​​i9-10980XE (поряд з Ryzen 9 3950X, де це можливо) в широкому діапазоні застосувань. У наступному розділі розглядається SMT масштабування на 3990X конкретно, з деякими конкретними оцінками в додатках, таких як DaVinci Resolve за допомогою Puget Systems Extended еталонів для цього додатка. Нарешті, розділ розгінний обговорює наші результати розгону, з невеликою допомогою від матері-природи.

Всі тестові стенди були оснащені 64 Гб DDR4-3600 в чотирьох палок оперативної пам'яті. XMP була включена на обох системах AMD і Intel, але Intel Cascade Lake потрібно годинник DDR4-3200 RAM, а не DDR4-3600. Обидві системи Intel і AMD порівнювалися з Corsair MP600 SSD, хоча система AMD використовувала привід в режимі PCIe 4.0, в той час як установка Intel була обмежена PCIe 3.0.

RTX 2080 використовувався для забезпечення тестування GPU у всіх випадках, з Nvidia GeForce Game Ready Driver 442.19. Останні UEFI зображення були завантажені на всіх материнських платах.

Кілька додатків конкретні зауваження, перш ніж приступити до роботи: Я включив результати MATLAB тут. MATLAB виступає Intel за замовчуванням з причин, які ми обговорюємо в набагато більш докладно в цій статті. Я протестовані від AMD з «Каліка AMD» інструкції і включений (за замовчуванням) і інвалідів.

Ми також додали значне навантаження напівпрофесійних / робочої станції. П'юджет Systems поширює свій власний розширений набір бенчмарка для різних додатків, в тому числі DaVinci Resolve. Ці тести не обманюйте навколо - Resolve люкс 8K DaVinci вимагає GPU з до 20 ГБ VRAM, що виключало нас від тестування. використовували наступне å безкоштовну пробну версію DaVinci Studio, який не впливає на продуктивність одного H.264 тесту відповідно до П'юджет, але результати випробувань, які ми представляємо є точними по відношенню до цієї версії додатка і тієї ж бігала навантаження в програмному забезпеченні на всіх процесори ми тестували. У мене є дані Agisoft Metashape як добре, але я зрозумів, в неділю ввечері, що мені потрібно повторно перевірити ці результати.

Арнольд Рендер Benchmark CPU - Антоніо Bosi
Арнольд Рендер Benchmark CPU - Антоніо Bosi

Особлива подяка Антоніо Боси, який розробив наш Maya 2020 Арнольд Рендер тест процесора шляхом зміни сцени з його існуючого набору тестів. Антоніо підтримує свій сайт з рядом Arnold Рендер підручники, особисті мистецтв і 3D моделі для завантаження. Пристосована версія стандартного Швидкого тесту масштабується приблизно на чотири відсотки краще, ніж аромат за замовчуванням, і при 1.4x масштабування над 3970X, поставила наші сильний надавати Підняття між двома процесорами.

05_030_A
05_030_A

Ми також завантажили кілька сцен Blender для тестового рендеринга, всі з яких були використані в Blender відкритого фільмі Два скріншотів представницьких кадрів анімації показані вище і нижче «Весна.»:

03_005_A
03_005_A

результати випробувань

Тести включали: 7zip, блендер (автономний тест і повне застосування), Cinebench R15 і R20, 1,31 стоянкового гальма, Індиго лави, Майя 2020 року, акуратні лави, POV-Ray 3.7, а також тест компіляції Qt за допомогою MSVC 2019.

Ми бачимо дві різні профілі продуктивності в цих результатах. У деяких додатках - зазвичай рендеринга застосування - 3990X є 1.3x - 1.4x швидше, ніж 3970X. Деякі тести, такі як V-Ray, пророкують ще більш сильне масштабування. Ми протестували ряд додатків візуалізації, щоб продемонструвати, що в багатьох випадках, існуюче програмне забезпечення робить скористатися цими можливостями. У деяких випадках, як Арнольд Рендер, то 3990X навіть наближається до доказу рентабельного проти 10980XE, який приймає 3.63x більше, щоб зробити нашу тестову сцену і стоїть на 25 відсотків більше. Ми також розглянемо рендерер, яка не масштабироваться в нашому SMT розділі.

Поза рендеринга застосувань 3970X зазвичай є кращим вибором, особливо з огляду на, що це більш тісної співпраці зі звичайною версією Windows, 10. Усередині надає додатків, зокрема, на професійному рівні, то підвищення продуктивності може бути варто оголошень з готівкою, щоб спалити ,

Я впав спиною до використання слайд-шоу для цієї статті через обсяг даних, але деякі з наших результатів не вписуються в цей формат з різних причин. Наш MATLAB тест був наданий Intel для тестування продуктивності Ядра i9-10980XE в. У таблиці нижче наведені характеристики MATLAB по апаратному AMD проти Intel.

Від 4.3GHz All-Core оверклокинг SMT скейлінга: всеосяжний огляд AMD Threadripper 3990X

MATLAB являє собою програму, що не масштабується повз 64 потоків на Windows 10 Pro. В результаті 3990X відбувається повільніше, ніж 3970X з SMT включений, оскільки її базові годинник нижче, навіть в 32-ядерному режимі. Ми вже бачили кілька прикладів.

Від 4.3GHz All-Core оверклокинг SMT скейлінга: всеосяжний огляд AMD Threadripper 3990X

Тест Blender 1.0Beta2 заснований на старій версії Blender (2.79) і працює повільніше, ніж поточний смак (2.81). Він також падає на 10980XE з невідомих причин (10980XE не має цієї проблеми в практичному застосуванні). Blender є твердою перемогою для 3990X, і поки ми не бачимо наше найкраще масштабування в цьому визуализатора, то 3990X надає між 25 - 35 відсотків швидше, ніж 3970X в цих сценах.

SMT Scaling

Наш стандартний набір тестів досліджував масштабування продуктивності між 3970X і 3990X, як правило, знаходячи, що 3970X є більш сильним варіантом для звичайного користувача, але з певними поліпшеннями в певних робочих навантаженнях для 3990X. Тепер ми будемо дивитися на скейлінг SMT питанні під Windows 10.

Тести включали: Blender, DaVinci Resolve (Puget Systems), Keyshot 9, Maya 2020 року, Maxwell Render 4.2.

Є тільки кілька додатків, які показують продуктивність знижується, коли SMT включена, але Maxwell Render 4.2 безперечно робить. На жаль, сцена «Benchwell» включені в Maxwell Render 4 більше не буде навантаження в Maxwell Render 5, так що я не зміг перевірити, якщо та ж проблема виникає в новій версії тесту. Включення SMT відключення дає 3990X перемогу над 3970X, але не досить, щоб виправдати витрати на CPU.

Інші тести показали, однак, послідовне масштабування від включення SMT, і вигоду від його використання. Ми надали велику серію сцен Blender (лахмітника, пружинні, Агент 327, і пан Elephant), всі з яких показують різні відповіді на використання SMT. Я побіг ряд додаткових тестів робить, що тут не з'являється, тільки щоб зберегти набір даних керованими, і загальне поліпшення продуктивності в Blender на професійному рівні надає доступно через Blender Хмара є дуже послідовним 1,3 - 1.4x. Keyshot ваги трохи менше, на приблизно 1.2x-1.25x.

У DaVinci Resolve 16, Intel не виграє, але він виграв категорію ціна / продуктивність. 3990X ваги відкусив 3970X, але я не знаю, що багато людей будуть платити в 4 рази більше для посилення в 1.16x продуктивності. Це може дуже добре дійшла до якого конкретний кодека і параметри носіїв ви редагували, оскільки 3990X дійсно показують великі успіхи над 10980XE в декількох конкретних тестах.

Intel, тому, безумовно, як і раніше робить випадок для своєї власної користі і значущості цих навантажень. 3970X і 3990X вирізав реальну територію для себе, але вони не є слем данк в будь-якій ситуації.

розгін Продуктивність

17 років тому, буквально день в день, 10 лютого 2003, AMD випустила Athlon XP 2500+, 2800+ і 3000+. Для того, щоб розігнати 3000+ - і тому, що ми всі знали, що в той час, що він не може зрівнятися з Pentium 4 з тактовою за замовчуванням - я встромив його зовні OC його, і натиснув на процесор до 2,6 ГГц, 1.2x більше акцій. Я ніколи не робив це знову, поки в кінці минулого тижня. Ця стаття була спочатку передбачалося запустити в п'ятницю, але я лоскотав, що це насправді працює сьогодні, тому що наявність дати вирівняйте це абсолютно весело. 3990X досить хороший розгін процесора, якщо мій один зразок що-небудь, щоб пройти, і той факт, що ця стаття працює в той же день просто глазур на торті.

Як би мені це зробити? Я засунув всю систему зовні в 12F / -11C повітря. Я насправді експериментував з тестуванням системи всередині, поставивши додатковий охолоджуючий вентилятор і радіатор процесора + вентилятор в зборі проти екрану вікна, тому кулер може малювати безпосередньо з зовнішнього повітря. Тоді я блокував ванної кімнати отвір і опечатали кімнату, щоб дозволити падіння температури. Це працювало до точки, але він не забезпечує охолодження я хотів. Рішення: Відкритий розгін.

Крім того, це звучить краще, ніж «ванна розгін.»

Хто мав два великих пальця і ​​нещаслива ця ідея не працює? Я, ось хто.
Хто мав два великих пальця і ​​нещаслива ця ідея не працює? Я, ось хто.

Я почав відчувати на всі ядра 3.7GHz і 1.4V, але це було занадто багато напруги для Asus Zenith II Extreme. Захист OCP на материнській платі буде удар на півдорозі через стрес-тести. Зниження напруги на 1.35V виробляються кращі результати. Я побіг повний блендер Benchmark 1.0beta 2 люкс на рівні 3,6, 3,7, 3,8 і 3.9GHz все-жильний, зниження напруги на кожному кроці.

У 3.9GHz і 1.3275v, я вирішив стрибнути. Я знав, що все-ядро 4GHz НЕ розірве 32K знак, який, де мені потрібно бути, щоб перемогти (в даний час другої за величиною) бала. Я набрав у 4.1GHz і вона публікується ... але моя оцінка була занадто низькою. Так як я написав статтю в п'ятницю, світовий рекорд був затребуваний кимось з 5.3GHz розгоном, і я знав, що я не збирався вдарити, але я думав, що я тільки міг би керувати, щоб посісти друге місце.

На даний момент, це близько 1:30 ранку в неділю вранці. Будь проїжджаючих повз спостерігали б чудове видовище - блискучий (бо, звичайно, як на материнській платі і оперативної пам'яті LED обладнаний) зірка, сяюча в моєму дворі. Якби вони зближуються, вони б здивувалися міцним, невибагливим, і несподівано надзвичайно цінна тумба відважно тримає близько $ 6000 в комп'ютерних техніках з усього комп'ютерного обладнання ніколи не повинна дотик. Без діла. Без гвинтів. З сказав апаратного розташований в тому, що могло б милосердно назвати «хитким використання доступного простору.»

Я вважав це. Я розглядав мудрість тестування надзвичайно дорогого устаткування в нічний час, на відкритому повітрі. Я думав про сніг і вітер, і передбачається, той факт, що я бігала помітно менше напруги, ніж я використовував для підтримки стабільної 3.7GHz OC.

Якщо ви хочете бути хорошим розгоном, ви повинні зрозуміти, як мистецтво. Системи не просто стати випадковим нестабільними. Там в порядок і ієрархія. Системи повинні POST, завантаження, а потім запустити тести. Чим довше і більш строгий тест, який ви можете запустити, тим більше вірогідності, що розгін є стабільним. Я знав, що 3.7GHz все ядро ​​було досить стабільним, щоб пробігти справедливу суму тестів, і що 3.9GHz був стабільним через блендер. Я знав, що не може бути занадто далеко від удару максимального струмового захисту материнської плати, однако. Процесор вхолосту на 6С в замороженому пустиря мого ... переддвір'я, але під навантаженням, вона вже потрапивши 67C. Розгін процесорів часто набагато більш чутливі, ніж термічно їх акції розганяв колегами, і 67C було вже більше, ніж мені було комфортно с.

Кожен раз, коли ви натискаєте процесора до зовнішнього краю конверта (і тут, це може означати що-небудь від штатного кулера до LN2), ти танцюєш на голівці шпильки. Це азартна гра, що ви можете налаштувати процесор досить просто тягнуть результат тесту, не впливаючи на продуктивність таким чином, що вбиває чистий ефект вашого вдосконалення.

CPU розсіюється зростає з TDP, але вона збільшується набагато сильніше в результаті напруги. Я грав, що я зменшив досить VRM навантаження, що вона може обробляти 4.3GHz все-ядро в 1.3275v, незважаючи на те, що я бачив машину жорстких проводів в 4GHz і 1 ..

Майте на увазі, що ми говоримо про тактову частоту процесора, що ось-ось 1.26x більше, ніж будь-де оцінити тактова 3990X сидить на регулярній основі, і ми говоримо про роблять це на 64 процесорних ядер одночасно. Всі процесори 4.3GHz = 275.2GHz. 0.275THz. Так, він починається з десятковою маються на. Чи не все одно.

Я відчував, як Хан Соло досягає гіперпросторових важелів на Тисячолітнього сокола, якщо Хан був найбільший млинець ботанік на Землі. Мої руки замерзали, мої вуха оніміли, мій переддвір'я звучав, як фен, а вишка вже налякала собаку ходити повз. Це був час, щоб подивитися, що у неї було. Я надрукував «43," хіт «Зберегти і вийти» і схрестив пальці. Вона вивішених. Завантажитеся.

Від 4.3GHz All-Core оверклокинг SMT скейлінга: всеосяжний огляд AMD Threadripper 3990X

Брав світовий рекорд другого місця в Cinebench R20 і в Cinebench R15, хоча я все ще працюю над процесом подання до HWBOT.

Я був рецензентом 18,5 років. Я тестував системи на суму понад $ 10000. Я ніколи не протестували процесор, який можна було б назвати другим найшвидшим на що-небудь на планеті. Навіть знаючи, що мій власний рекорд скоро буде зламаний 3990X власників з LN2 і екзотичними охолоджуючими установками, що не залежать від погодних умов, навіть знаючи, що результат був просто в якості орієнтира, є деякі що, безсумнівно, прохолодно про це.

Я не думаю, що люди збираються, щоб отримати 4.3GHz розгін з 3990X на регулярній основі, але більш низькі годинник, здається, надзвичайно можливо. Наведені вище результати показують, що вони можуть забезпечити стійке перевагу і напруга, необхідне для підтримки змінного струму 3.7GHz явно нижче 1.3275v, враховуючи, що я використовував те ж саме напруга, щоб вразити 4.3GHz. Я залишу його виробник, як Boxx, щоб з'ясувати, які можливості є, але ці результати тестування означає, що вони можуть бути хорошими.

У правих робочих навантаженнях, для правильного покупця, розгін 3990X може здоровий глузд. Мій виступ покращився на 10 - 17 відсотків переміщення запасу від 3,7 В змінного струму.

висновок

3990X НЕ CPU для всіх. Вона не масштабується досить добре, щоб об'єктивно виправдати свою ціну, якщо ви не магазин на ринках, де ціна не об'єкт. Навіть якщо припустити, краще масштабування від Linux або Enterprise Windows, то малоймовірно, що достатня кількість додатків, було б корисно, щоб зробити чіп об'єктивне поліпшення для багатьох покупців.

Все це абсолютно нормально для продуктів у верхній частині стека продукту. Intel Xeon W-3265 представляє собою 24-ядерний чіп на 2,7 ГГц базових / 4.4GHz імпульс. Xeon W-3275 представляє собою 28-ядерний процесор на 2,5 ГГц базових / 4.4GHz імпульс. W-3265 коштує $ 3349. W-3275 складає $ 4449. Це збільшення 1.32x цін на 1.17x збільшення основного рахунку. Xeon Платиновий 8280 є $ 10009 процесор з 28 ядрами, то Xeon Платиновий 8270 є $ 7405 процесор з 26 ядрами. Ніхто не блимає, коли ціни Intel частини таким чином, не дивлячись на те, що немає навантаження на Землі, де 8280 збирається поставляти розумний підйом по 8270 тільки з двома додатковими ядрами.

Але 3990X не намагається бути всім для всіх людей. Це лавровий вінок. Це перемога коло. 3970X є процесор, який насправді призначений йти нога в ногу з тим, що Intel може запропонувати; Це 3990X, що заклепки угоди, для клієнта AMD, для яких гроші не об'єкт.

Що ж стосується значення цього? Це перший раз в 15 років, що AMD була продукт, який не конкурували за «гроші не об'єкт» сегмент в першу чергу. Ви повинні повернутися до часів двоядерного Opteron і Athlon 64 FX, коли AMD зіштовхнулася з проти Prescott і Smithfield, щоб знайти час, коли AMD був настільки впевнений у своїй ендшпілі, щоб почати участь в такому роді позиції. Інші оглядачі, має доступ до більш дорогому Xeons, ніж у мене, підтвердили, що AMD виграє тести проти $ 20K цінності Xeon процесорів в різних областях. Це свого роду невідповідність продуктивності, що може зробити навіть «Гроші не об'єкт» натовп сидіти і приймати повідомлення.

Гарно зіграно.

Читати далі

"Неможливо", насправді неможливо, всеосяжні тестові шоу
"Неможливо", насправді неможливо, всеосяжні тестові шоу

Гіпотетичний серверний ракетний двигун загрожував підвищеннюючим те, що ми знали про фізику ... якщо він працював. Після останнього раунду тестування можна сказати з високим ступенем визначеності, що це не так.

Швидкість льодовикового плавлення прискорюється, всеосяжне дослідження
Швидкість льодовикового плавлення прискорюється, всеосяжне дослідження

Дослідники виявили, що швидкість втрати льоду від льодовиків прискорилося протягом перших двох десятилітьх 21-го століття, і є всі причини очікувати, що тенденція буде продовжуватися.