От 4.3GHz All-Core оверклокинг SMT скейлинга: всеобъемлющий обзор AMD Threadripper 3990X

От 4.3GHz All-Core оверклокинг SMT скейлинга: всеобъемлющий обзор AMD Threadripper 3990X

AMD провела последние три года переписывает правила производительности рабочего стола. В пятницу производитель микропроцессор AMD запустила Ryzen Threadripper 3990X, первый в мире односокетных 64-ядерный процессор. Я уже написал тизер для этой статьи и перешли некоторые из моих ранних мыслей на процессоре, но вот где мы покопаться в данных на чипе и посмотреть, что отчеты могут сказать нам.

При правильных обстоятельствах Ryzen Threadripper 3990X предлагает невероятную производительность. В неоптимизированному рабочих нагрузок, это плоские или даже снижение против Ryzen Threadripper 3970X. Я потратил много времени на ввод процессора через его шаги, ищу сценарии, где она преуспевает и анализ, где она падает плоской. Я также бросил его на улице в 12-градусный Фаренгейт (-11C) воздухе и разогнал его с помощью Asus Zenith II Extreme, просто для удовольствия. Мы будем говорить об этом, тоже. Я, возможно, пропустил мировой рекорд для предприимчивого человека с жидким азотом, но CB20 мячом я ударил бы по-прежнему претендовать на эту систему второго места в соответствии с HWBOT.

Я предполагаю, что вы знаете о Threadripper 3990X и прочитали наш обзор 3970X, плюс обсуждение 3990X запуск с прошлой недели.

Windows, планировщик потоков

Один из вопросов, затрагивающих наши результаты для Windows 10 является то, что операционная система не масштабируется выше 64 потоков очень эффективно. Операционная система расщепляет рабочие нагрузки центрального процессора в процессор групп, до 64 потоков, назначенных каждой группе. Некоторые приложения предоставляют свои собственные планировщик потоков, но приложения, которые не часто закрывают на ~ 50 процентов загрузки процессора на 3990X. Linux масштабирование, как правило, лучше; Rob Williams в Techgage имеет больше данных по этому вопросу. приложения рендеринга 3D легко сильнейшие потребительные категории для 3990X, который ставит свои сильные показатели масштабирования в этих приложениях. Там были сообщения о том, для Windows 10 Enterprise может предложить лучшее масштабирование, но наши контакты на AMD показали, что нет никаких оснований для пользователя, чтобы запустить Windows 10 Enterprise при покупке 3990X. Официальное руководство от AMD является то, что для Windows 10 Pro достаточно.

(Отсутствие) Intel конкуренции

Мы обратились к Intel, чтобы узнать, если компания будет предоставлять серверные Xeon процессоров для сравнения против 3990X, но компания решила не образец с процессором AMD. В то время как эти сравнения не выровнены по цене, они бы позволили нам сравнивать топовые решения от обеих компаний. Без опции для рисования на Xeon, наше сравнение автомобиль был ограничен Основной i9-10980XE.

В ~ $ 1000, то 10980XE не может считаться справедливой конкуренцией за $ 4000 3990X, но это ближе Intel CPU мы, и я хотел, чтобы дать некоторое представление о том, как это сложено. Поскольку различные приложения имеют такие различные ответы на высокой ключевых количества процессоров, существуют случаи, когда 10980XE соответствует или превосходит 3990X. Больше ядер не всегда лучше, даже сегодня.

Результаты настройки форматирования, тестирования

Этот обзор имеет большую площадь, чем мой типичный охват, и я разделил результаты на несколько различных категории. Наш стандартный набор тестов сравнивает верхнюю Threadripper и ядро ​​i9-10980XE (наряду с Ryzen 9 3950X, где это возможно) в широком диапазоне применений. В следующем разделе рассматривается SMT масштабирования на 3990X конкретно, с некоторыми конкретными оценками в приложениях, таких как DaVinci Resolve с помощью Puget Systems Extended эталонов для этого приложения. Наконец, раздел разгонный обсуждает наши результаты разгона, с небольшой помощью от матери-природы.

Все тестовые стенды были оснащены 64 Гб DDR4-3600 в четырех палок оперативной памяти. XMP была включена на обоих системах AMD и Intel, но Intel Cascade Lake требуется часы DDR4-3200 RAM, а не DDR4-3600. Обе системы Intel и AMD сравнивались с Corsair MP600 SSD, хотя система AMD использовала привод в режиме PCIe 4.0, в то время как установка Intel была ограничена PCIe 3.0.

RTX 2080 использовался для обеспечения тестирования GPU во всех случаях, с Nvidia GeForce Game Ready Driver 442.19. Последние UEFI изображения были загружены на всех материнских платах.

Несколько приложений конкретные замечания, прежде чем приступить к работе: Я включил результаты MATLAB здесь. MATLAB выступает Intel по умолчанию по причинам, которые мы обсуждаем в гораздо более подробно в этой статье. Я протестированные от AMD с «Калека AMD» инструкции и включен (по умолчанию) и инвалидов.

Мы также добавили значительную нагрузку полупрофессиональных / рабочей станции. Пьюджет Systems распространяет свой собственный расширенный набор бенчмарка для различных приложений, в том числе DaVinci Resolve. Эти тесты не обманывайте вокруг - Resolve люкс 8K DaVinci требует GPU с до 20 ГБ VRAM, что исключало нас от тестирования. использовали следующее å бесплатную пробную версию DaVinci Studio, который не влияет на производительность одного H.264 теста в соответствии с Пьюджет, но результаты испытаний, которые мы представляем являются точными по отношению к этой версии приложения и той же бегала нагрузки в программном обеспечении на всех процессоры мы тестировали. У меня есть данные Agisoft Metashape как хорошо, но я понял, в воскресенье вечером, что мне нужно повторно проверить эти результаты.

Арнольд Рендер Benchmark CPU - Антонио Bosi
Арнольд Рендер Benchmark CPU - Антонио Bosi

Особая благодарность Антонио Боси, который разработал наш Maya 2020 Арнольд Рендер тест процессора путем изменения сцены из его существующего набора тестов. Антонио поддерживает свой сайт с рядом Arnold Рендер учебники, личные искусств и 3D модели для загрузки. Приспособленная версия стандартного Быстрого теста масштабируется примерно на четыре процента лучше, чем аромат по умолчанию, и при 1.4x масштабирования над 3970X, поставила наши сильный оказывать Поднятие между двумя процессорами.

05_030_A
05_030_A

Мы также загрузили несколько сцен Blender для тестового рендеринга, все из которых были использованы в Blender открытого фильме Два скриншотов представительных кадров анимации показаны выше и ниже «Весна.»:

03_005_A
03_005_A

Результаты теста

Тесты включали: 7zip, блендер (автономный тест и полное применение), Cinebench R15 и R20, 1,31 стояночного тормоза, Индиго скамьи, Майя 2020, аккуратные скамьи, POV-Ray 3.7, а также тест компиляции Qt с помощью MSVC 2019.

Мы видим две различные профили производительности в этих результатах. В некоторых приложениях - обычно рендеринга применения - 3990X является 1.3x - 1.4x быстрее, чем 3970X. Некоторые тесты, такие как V-Ray, предсказывают еще более сильное масштабирование. Мы протестировали ряд приложений визуализации, чтобы продемонстрировать, что во многих случаях, существующее программное обеспечение делает воспользоваться этими возможностями. В некоторых случаях, как Арнольд Рендер, то 3990X даже приближается к доказательству рентабельного против 10980XE, который принимает 3.63x больше, чтобы сделать нашу тестовую сцену и стоит на 25 процентов больше. Мы также рассмотрим рендерер, который не масштабироваться в нашем SMT разделе.

Вне рендеринга применений 3970X обычно является лучшим выбором, особенно учитывая, что это более тесного сотрудничества с обычной версией Windows, 10. Внутри оказывающего приложений, в частности, на профессиональном уровне, то повышение производительности может быть стоит объявлений с наличными деньгами, чтобы сжечь ,

Я упал спиной к использованию слайд-шоу для этой статьи из-за объема данных, но некоторые из наших результатов не вписываются в этот формат по разным причинам. Наш MATLAB тест был предоставлен Intel для тестирования производительности Ядра i9-10980XE в. В таблице ниже приведены характеристики MATLAB по аппаратному AMD против Intel.

От 4.3GHz All-Core оверклокинг SMT скейлинга: всеобъемлющий обзор AMD Threadripper 3990X

MATLAB представляет собой приложение, которое не масштабируется мимо 64 потоков на Windows 10 Pro. В результате 3990X происходит медленнее, чем 3970X с SMT включен, поскольку ее базовые часы ниже, даже в 32-ядерном режиме. Мы уже видели несколько примеров.

От 4.3GHz All-Core оверклокинг SMT скейлинга: всеобъемлющий обзор AMD Threadripper 3990X

Тест Blender 1.0Beta2 основан на старой версии Blender (2.79) и работает медленнее, чем текущий вкус (2.81). Он также падает на 10980XE по неизвестным причинам (10980XE не имеет этой проблемы в практическом применении). Blender является твердой победой для 3990X, и пока мы не видим наше самое лучшее масштабирование в этом визуализатора, то 3990X оказывает между 25 - 35 процентов быстрее, чем 3970X в этих сценах.

SMT Scaling

Наш стандартный набор тестов исследовал масштабирование производительности между 3970X и 3990X, как правило, находя, что 3970X является более сильным вариантом для обычного пользователя, но с определенными улучшениями в определенных рабочих нагрузках для 3990X. Теперь мы будем смотреть на скейлинге SMT вопросе под Windows 10.

Тесты включали: Blender, DaVinci Resolve (Puget Systems), Keyshot 9, Maya 2020, Maxwell Render 4.2.

Есть только несколько приложений, которые показывают производительность снижается, когда SMT включена, но Maxwell Render 4.2 определенно делает. К сожалению, сцена «Benchwell» включены в Maxwell Render 4 больше не будет нагрузки в Maxwell Render 5, так что я не смог проверить, если та же проблема возникает в новой версии теста. Включение SMT отключения дает 3990X победу над 3970X, но не достаточно, чтобы оправдать затраты на CPU.

Другие тесты показали, однако, последовательное масштабирование от включения SMT, и выгоду от его использования. Мы оказали обширную серию сцен Blender (старьевщика, пружинные, Агент 327, и г-н Elephant), все из которых показывают различные ответы на использование SMT. Я побежал ряд дополнительных тестов делает, что здесь не появляется, только чтобы сохранить набор данных управляемыми, и общее улучшение производительности в Blender на профессиональном уровне оказывает доступно через Blender Облако является очень последовательным 1,3 - 1.4x. Keyshot весы немного меньше, на примерно 1.2x-1.25x.

В DaVinci Resolve 16, Intel не выигрывает, но он выиграл категорию цена / производительность. 3990X весы откусил 3970X, но я не знаю, что многие люди будут платить в 4 раза больше для усиления в 1.16x производительности. Это может очень хорошо дошедшее до какого конкретный кодека и параметры носителей вы редактировали, поскольку 3990X действительно показывают большие успехи над 10980XE в нескольких конкретных тестах.

Intel, поэтому, безусловно, по-прежнему делает случай для своей собственной полезности и значимости этих нагрузок. 3970X и 3990X вырезал реальную территорию для себя, но они не являются слэм данк в любой ситуации.

Разгон Производительность

17 лет назад, буквально день в день, 10 февраля 2003, AMD выпустила Athlon XP 2500+, 2800+ и 3000+. Для того, чтобы разогнать 3000+ - и потому, что мы все знали, что в то время, что он не может сравниться с Pentium 4 с тактовой по умолчанию - я воткнул его снаружи OC его, и нажал на процессор до 2,6 ГГц, 1.2x более акций. Я никогда не делал это снова, пока в конце прошлой недели. Эта статья была первоначально предполагалось запустить в пятницу, но я щекотал, что это на самом деле работает сегодня, потому что наличие даты совместите это совершенно весело. 3990X довольно хороший разгон процессора, если мой один образец что-нибудь, чтобы пройти, и тот факт, что эта статья работает в тот же день просто глазурь на торте.

Как бы мне это сделать? Я засунул всю систему снаружи в 12F / -11C воздуха. Я на самом деле экспериментировал с тестированием системы внутри, поставив дополнительный охлаждающий вентилятор и радиатор процессора + вентилятор в сборе против экрана окна, поэтому кулер может рисовать непосредственно из наружного воздуха. Тогда я блокировал ванной комнаты отверстие и опечатали комнату, чтобы позволить падение температуры. Это работало до точки, но он не обеспечивает охлаждения я хотел. Решение: Открытый разгон.

Кроме того, это звучит лучше, чем «ванная разгон.»

Кто имел два больших пальца и несчастлива эта идея не работает? Я, вот кто.
Кто имел два больших пальца и несчастлива эта идея не работает? Я, вот кто.

Я начал испытывать на все ядра 3.7GHz и 1.4V, но это было слишком много напряжения для Asus Zenith II Extreme. Защита OCP на материнской плате будет удар на полпути через стресс-тесты. Понижение напряжения на 1.35V производятся лучшие результаты. Я побежал полный блендер Benchmark 1.0beta 2 люкс на уровне 3,6, 3,7, 3,8 и 3.9GHz все-жильный, снижение напряжения на каждом шаге.

В 3.9GHz и 1.3275v, я решил прыгнуть. Я знал, что все-ядро 4GHz не разорвет 32K знак, который, где мне нужно быть, чтобы победить (в настоящее время второй по величине) балла. Я набрал в 4.1GHz и она публикуемая ... но моя оценка была слишком низкой. Так как я написал статью в пятницу, мировой рекорд был востребован кем-то с 5.3GHz разгоном, и я знал, что я не собирался ударить, но я думал, что я только мог бы управлять, чтобы занять второе место.

На данный момент, это около 1:30 утра в воскресенье утром. Любой проезжающих мимо наблюдали бы замечательное зрелище - блестящий (потому что, конечно, как на материнской плате и оперативной памяти LED оборудованный) звезда, сияющая в моем дворе. Если бы они сближаются, они бы поразились прочным, непритязательным, и неожиданно чрезвычайно ценная тумба отважно держит около $ 6000 в компьютерных техниках из всего компьютерного оборудования никогда не должна прикосновение. Без дела. Без винтов. С сказал аппаратного расположен в том, что могло бы милосердно назвать «шатким использование доступного пространства.»

Я считал это. Я рассматривал мудрость тестирования чрезвычайно дорогостоящего оборудования в ночное время, на открытом воздухе. Я думал про снег и ветер, и предполагается, тот факт, что я бегала заметно меньше напряжения, чем я использовал для поддержания стабильной 3.7GHz OC.

Если вы хотите быть хорошим разгоном, вы должны понять, как искусство. Системы не просто стать случайным нестабильными. Там в порядок и иерархия. Системы должны POST, загрузки, а затем запустить тесты. Чем дольше и более строгий тест, который вы можете запустить, тем больше вероятности, что разгон является стабильным. Я знал, что 3.7GHz все ядро ​​было достаточно стабильным, чтобы пробежать справедливое количество тестов, и что 3.9GHz был стабильным через блендер. Я знал, что не может быть слишком далеко от удара максимальной токовой защиты материнской платы, однако. Процессор вхолостую на 6С в замороженном пустыря моего ... передний двор, но под нагрузкой, она уже попав 67C. Разгон процессоров зачастую гораздо более чувствительны, чем термически их акции разгонял коллегами, и 67C было уже больше, чем мне было комфортно с.

Каждый раз, когда вы нажимаете процессора к внешнему краю конверта (и здесь, это может означать что-нибудь от штатного кулера к LN2), ты танцуешь на булавочной головке. Это азартная игра, что вы можете настроить процессор достаточно просто влачат результат теста, не влияя на производительность таким образом, что убивает чистый эффект вашего совершенствования.

CPU рассеиваемой мощности возрастает с TDP, но она увеличивается гораздо сильнее в результате напряжения. Я играл, что я уменьшил достаточно VRM нагрузки, что она может обрабатывать 4.3GHz все-ядро в 1.3275v, несмотря на то, что я видел машину жестких проводов в 4GHz и 1..

Имейте в виду, что мы говорим о тактовой частоте процессора, что вот-вот 1.26x больше, чем где бы оценить тактовая 3990X сидит на регулярной основе, и мы говорим о делают это на 64 процессорных ядер одновременно. Все процессоры 4.3GHz = 275.2GHz. 0.275THz. Да, он начинается с десятичной. Не все равно.

Я чувствовал, как Хан Соло достигающий гиперпространственных рычагов на Тысячелетнего сокола, если Хан был самый большой блин ботаник на Земле. Мои руки замерзали, мои уши онемели, мой передний двор звучал, как фен, а вышка уже напугала собаку ходить мимо. Это было время, чтобы посмотреть, что у нее было. Я напечатал «43,» хит «Сохранить и выйти» и скрестил пальцы. Она вывешенным. Загрузитесь.

От 4.3GHz All-Core оверклокинг SMT скейлинга: всеобъемлющий обзор AMD Threadripper 3990X

Принимал мировой рекорд второго места в Cinebench R20 и в Cinebench R15, хотя я все еще работаю над процессом представления в HWBOT.

Я был рецензентом 18,5 лет. Я тестировал системы на сумму более $ 10000. Я никогда не протестировали процессор, который можно было бы назвать вторым самым быстрым на что-либо на планете. Даже зная, что мой собственный рекорд скоро будет сломан 3990X владельцев с LN2 и экзотическими охлаждающими установками, которые не зависят от погодных условий, даже зная, что результат был просто в качестве ориентира, есть кой-что, несомненно, прохладно об этом.

Я не думаю, что люди собираются, чтобы получить 4.3GHz разгон из 3990X на регулярной основе, но более низкие часы, кажется, в высшей степени возможно. Приведенные выше результаты показывают, что они могут обеспечить устойчивое преимущество и напряжение, необходимое для поддержания переменного тока 3.7GHz явно ниже 1.3275v, учитывая, что я использовал то же самое напряжение, чтобы поразить 4.3GHz. Я оставлю его производитель, как Boxx, чтобы выяснить, какие возможности есть, но эти результаты тестирования означает, что они могут быть хорошими.

В правых рабочих нагрузках, для правильного покупателя, разгон 3990X может здравый смысл. Мое выступление улучшилось на 10 - 17 процентов перемещения запаса от 3,7 В переменного тока.

Вывод

3990X не CPU для всех. Она не масштабируется достаточно хорошо, чтобы объективно оправдать свою цену, если вы не магазин на рынках, где цена не объект. Даже если предположить, лучшее масштабирование от Linux или Enterprise Windows, то маловероятно, что достаточное количество приложений, было бы полезно, чтобы сделать чип объективное улучшение для многих покупателей.

Все это совершенно нормально для продуктов в верхней части стека продукта. Intel Xeon W-3265 представляет собой 24-ядерный чип на 2,7 ГГц базовых / 4.4GHz импульс. Xeon W-3275 представляет собой 28-ядерный процессор на 2,5 ГГц базовых / 4.4GHz импульс. W-3265 стоит $ 3349. W-3275 составляет $ 4449. Это увеличение 1.32x цен на 1.17x увеличения основного счета. Xeon Платиновый 8280 является $ 10009 процессор с 28 ядрами, то Xeon Платиновый 8270 является $ 7405 процессор с 26 ядрами. Никто не мигает, когда цены Intel части таким образом, несмотря на то, что нет нагрузки на Земле, где 8280 собирается поставлять разумный подъем по 8270 только с двумя дополнительными ядрами.

Но 3990X не пытается быть всем для всех людей. Это лавровый венок. Это победа круг. 3970X является процессор, который на самом деле предназначен идти нога в ногу с тем, что Intel может предложить; Это 3990X, что заклепки сделки, для клиента AMD, для которых деньги не объект.

Что же касается значения этого? Это первый раз в 15 лет, что AMD была продукт, который не конкурировали за «деньги не объект» сегмент в первую очередь. Вы должны вернуться к временам двухъядерного Opteron и Athlon 64 FX, когда AMD столкнулась с против Prescott и Smithfield, чтобы найти время, когда AMD был настолько уверен в своей эндшпиле, чтобы начать участие в таком роде позиции. Другие обозреватели, имеющий доступ к более дорогому Xeons, чем у меня, подтвердили, что AMD выигрывает тесты против $ 20K ценности Xeon процессоров в различных областях. Это своего рода несоответствие производительности, что может сделать даже «Деньги не объект» толпа сидеть и принимать уведомления.

Отлично сработано.

Читать далее

Обзор: Oculus Quest 2 может стать переломным моментом для массового внедрения VR
Обзор: Oculus Quest 2 может стать переломным моментом для массового внедрения VR

Oculus Quest 2 теперь доступен, и это улучшение по сравнению с оригиналом во всех отношениях. И все же это на 100 долларов дешевле, чем последний выпуск. Проведя некоторое время с Quest 2, я считаю, что мы можем оглянуться на него как на гарнитуру, которая наконец сделала VR доступной для массовых потребителей.

Обзор MSI Nvidia RTX 3070 Gaming X Trio: производительность 2080 Ti, цены на Pascal
Обзор MSI Nvidia RTX 3070 Gaming X Trio: производительность 2080 Ti, цены на Pascal

Новый RTX 3070 от Nvidia - потрясающий графический процессор по хорошей цене, и MSI RTX 3070 Gaming X Trio хорошо это демонстрирует.

Обзор: новый DJI Mini 2 может стать идеальным дроном для путешествий
Обзор: новый DJI Mini 2 может стать идеальным дроном для путешествий

Если вы любите путешествовать со своим дроном, но ненавидите таскать с собой много оборудования, DJI Mini 2 может стать идеальным решением.

Обзор Ryzen 9 5950X и 5900X: AMD демонстрирует Zen 3 против последних бастионов производительности Intel
Обзор Ryzen 9 5950X и 5900X: AMD демонстрирует Zen 3 против последних бастионов производительности Intel

AMD продолжает натиск на то, что когда-то было бесспорным дерн Intel.