Представляющий Tracbench, новый тестовый тест на транскодирование AI

Представляющий Tracbench, новый тестовый тест на транскодирование AI

Немного года назад я начал экспериментировать с реставрацией видео и AI Upscaling для моего глубокого пространства девять высококлассных проектов. Сегодня я хотел бы поговорить о контрольном этапе, которую я построил в рамках этих усилий, и какое интересное, что он может рассказать нам о ультрасовершенствовании производительности рабочей станции. Такие дискуссии не очень весело без практического оборудования, чтобы играть, поэтому мы также будем изучить, как производительность в наших новых тестовых масштабах между Threadripper AMD Ryzen Threadripper 3990x с 64 ядрами и четырьмя каналами RAM, а также ryzen Threadripper Pro 3995WX Рабочая станция Lenovo ThinkStation P620 с одинаковыми 64 ядрами и восьми каналами RAM.

Представляющий Tracbench, новый тестовый тест на транскодирование AI

Оповещение спойлера: одна из причин, по которой я написал эту статью, заключается в том, чтобы продемонстрировать, насколько огневая передача современная верхняя система X86 может привлечь к рабочим нагрузкам в носительскую транскодирование в первую очередь. Общее качество Ai Upscaling продолжает улучшаться, а поклонники моего глубокого пространства девять высококлассных проектов должны знать, что я буду больше сказать об этом в ближайшем будущем.

В прошлом я полагался на ручной тормоз, чтобы захватить производительность транскодирования, но есть более гибкие инструменты, доступные с более широким диапазоном функций. Я экспериментировал с использованием Handbrake в качестве шага обработки в моих исследованиях за последние 15 месяцев, прежде чем решить другие инструменты, было лучше подходит для того, что я хотел сделать. Дизайн Tracbench - первые четыре буквы стоят для транскодирования, AI и преобразования - отражает то, что я узнал о расширении этих рабочих нагрузок в большом массиве ядер.

Tracbench 0.1 использует переплетенные кадры качества SD в качестве исходного источника. Несмотря на то, что приложения масштабирования AI, такие как TOPAZ, способны к аспланированию 720p или 1080p - отснятые материалы, 360p и 480p, более легко обрабатываются в разумное количество времени.

Транскодирование: Этот шаг использует StaxRip в качестве внешнего интерфейса для Avisynth и деинтурирует отснятый материал с использованием QTGMC. Tracbench 0.1 использует ту же настройки, опубликованные здесь и построен вокруг STAXRIP 2.1.3.0 с Avisynth + 3.6.1. StaxRip работает параллельно, используя несколько экземпляров того же приложения. StaxRip сконфигурирован, чтобы разрешить до восьми параллельных процессов на экземпляр приложения и предварительной выборки (8) использовали в каждом скрипте Avisynth. Мы проверяем до 16 одновременных кодов для загрузки всех 128 потоков Ryzen Threadripper 3990x и TEDRIPPER PRO 3995WX. Ryzen 9 5950X не может поддерживать столько параллельных кодов и намного на гораздо ниже максимума.

Ai Upscaling. В версии 0.1 этот шаг обрабатывается от Topaz 1.5.3. Это старая версия приложения, которая не поддерживает RTX 3000 или RDNA2 GPUS. Это не проблема для нас сегодня, потому что карты Quadro RTX 6000 внутри Lenovo ThinkStation P620 основаны на основе Turing. Будущие версии теста будут обновлять до последней версии топаза. Тестирование нескольких GPU на ThinkStation P620 обрабатывалось путем запуска одного экземпляра приложения на каждом графике GPU.

Преобразование: Последний шаг - преобразование высококалированных кадров и оригинальный аудио обратно в окончательное видео. Вывод кадров, а затем Recombizing их с помощью инструмента, такого как FFMPEG, дает превосходное качество, чтобы просто вывозить файл MP4 через TOPAZ. Tracbench 0.1 использует FFMPEG GIT-2020-08-28-CCC7120 и Libx264 для кодирования H.264. Будущие версии будут включать тестирование в H.265.

Мы можем продолжать использовать ручной тормоз для простого тестирования, но ручной тормоз не так полезен для передовой обработки видео как Avisynth. Avisynth - это видеоредактор командной строки, который предлагает широкий ассортимент фильтров для преобразования и редактирования видео различными способами. STAXRIP служит передней частью для него.

Lenovo ThinkStation P620 был идеальным испытанием для построения этого эталона. 3995WX внутри системы представляет собой верхний ryzen Threadripper Pro CPU. Он имеет немного более низкие часы, чем 3990x, но он предлагает вдвое больше максимальной пропускной способности памяти. 3990X имеет только один канал памяти на 16 ядер, в то время как 3995WX имеет два.

Представляющий Tracbench, новый тестовый тест на транскодирование AI

Существует компромисс между Threadripper Ryzen Threadripper 3995WX и Threadripper 3990x, с последним, предлагающим очень чуть более часовую скорость, но значительно меньшее количество пропускной способности памяти. Посмотрим, достаточно ли разница в наших тестах - и у нас также есть несколько дополнительных результатов между двумя системами вне этого теста.

Вместо того, чтобы пытаться сделать эти три системы как можно более похожими, я намеренно позволил их конфигурации различаться. Мы смотрим на три разных усилия, чтобы построить высококачественную рабочую станцию, по существу. Ryzen 9 5950X останавливает новый 16-ядерный процессор против более старого графического процессора с 2018 года. Threadripper Ryzen 3990X сохраняет тот же GPU, но увеличивает количество ядер и общей пропускной способности памяти. Оба этими системами выбирают менее дорогими, более крупные M.2 SSDS, с 2 ТБ мощности по сравнению с более быстрыми Samsung PM981 Polaris Drive, при 1 ТБ. Наконец, Lenovo ThinkStation P620 снова удваивает пропускную способность памяти и добавляет второй GPU. Каждая из этих систем может быть справедливо называться системой класса рабочей станции, но они делают разные компромиссы. Посмотрим, как эти компромиссы влияют на производительность.

Кстати, 3990X работает DDR4-2666, потому что мой процессор, который когда-то проработал на DDR4-3600 без проблем, теперь отказывается на часах выше 2666. Неоднократно просвечивая как RAM, так и CPU не влияло на это ограничение, и расслабляющие тайминги памяти до смешной степени не помогали системе разместить более высокие часы RAM.

Рабочая станция Lenovo ThinkStation P620

Lenovo ThinkStation P620 является действительно хорошим комплектом с несколькими странными привычками. Он имеет очень длинное время загрузки (~ 81 секунды), и он излучает два длинных звуковых сигнала, а затем три коротких звуковых сигнала, пока монитор включен. Это может быть связано с некоторым аспектом двойной конфигурации NVIDIA Quadro RTX 6000, потому что дисплей не инициализируется до тех пор, пока Windows 10 не подтягивает рабочий стол. Стабильность системы всегда была превосходной.

Панель Case находится навесной и поднимается прямо вдали от системы. Внутренняя макет ThinkStation P620 хорошо спроектирован, хотя снятие второго графического процессора может быть трудно в зависимости от того, насколько большая рука. Модули передней панели предназначены для адаптации к различным типам устройств, в зависимости от того, что вам нужно подключить.

Я собираюсь одолжить фотографию с нашей сестры на сайт PCMAG от обзора ThinkStation P620, потому что он показывает внутреннюю часть шасси без установленных видеокарт:

Представляющий Tracbench, новый тестовый тест на транскодирование AI

Вот более жесткий угол нашего ThinkStation P620, с установленными видеокартами.

Представляющий Tracbench, новый тестовый тест на транскодирование AI

Источник питания примечателен. Это легко, самый маленький источник питания 1 кВт, который я когда-либо видел, и он оценил 80 плюс Platinum. Он подключается непосредственно в материнскую плату, используя краевой разъем, видимый ниже:

Представляющий Tracbench, новый тестовый тест на транскодирование AI

Я разорван на этот аспект дизайна ThinkStation P620. Источник питания - это хорошостроенное устройство, и он подключен к материнской плате непосредственно к материнской плате без необходимости в Clunky 24-контактный кабель ATX. Есть вторичные кабели PCIe Power, установленные на краю материнской платы, которые путешествуют с материнской платы в графический процессор. Это объективно лучшая система для доставки мощности, но если ваш источник питания умирает, вы будете разговаривать с Lenovo о замене.

Представляющий Tracbench, новый тестовый тест на транскодирование AI

Активное охлаждение для игровых автоматов. Вероятно, не худшая идея, учитывая, насколько плотно упакованы вещи.

Представляющий Tracbench, новый тестовый тест на транскодирование AI

Система охлаждения немного необычна, но сохраняет систему стабильной, даже при устойчивой полной нагрузке. Мы устанавливаем систему, запустив 16 рабочих нагрузок транскодирования и два рабочих нагрузках AI UPSCaling одновременно. Потребляемая мощность на стене ударила 800 Вт, но система оставалась стабильной в течение восьмичасовой нагрузки. Шум вентилятора от GPU и процессора одновременно был значительным - я не хотел бы выходить на башню, если она сидела рядом с моей головой - но недостаточно, чтобы быть надому, если машина сидела под столом.

Тестовые ноты

Lenovo Thinkstation P620's Dual RTX 6000 GPU GPU гарантируют, что он выиграет тест AI ASCaling. Точка этого сравнения состоит в том, чтобы показать потенциальную усиление производительности при наступлении от верхней части потребительской карты с 2018 года до пары открытых карт. Весь точка Tracbench состоит в том, что она может масштабироваться от обычного потребительского оборудования для высококачественных рабочих станций, поэтому имеет смысл захватывать ряд точек данных (и ценников).

Результаты сегодня представлены только для систем AMD. Tracbench 0,1 был разработан на аппаратном обеспечении AMD, и мне не хватает доступа к виду двойных систем Xeon, которые конкурируют с Lenovo P620 в Core Count. Будущие итерации теста также включают информацию о масштабировании Intel Platformat по озеру ракетного озера, каскадного озера и более низких систем AMD.

Tracbench результаты

Транскодирование, AI и комбинированные шаги Каждый показывают различные характеристики производительности, поэтому мы обсудим их отдельно.

! Функция (e, i, n, s) {var t = "infogreds", d = e.getelementsbytagname ("Script") [0]; если (окно [T] && Window [T]. Инициализированное) окно [T]. .Process && Window [t] .Process (); else is (! e.getelementbyyed (n)) {var o = e.createidelement ("Script"); o.async = 1, o.id = n, o.src = "https://e.infogram.com/js/dist/embed-loader-min.js",d.parentnode.insertbefore((,d)} }(Document,0,ОТВИЗЯТЬСЯ

Транскодирование - это огромная победа для ThinkStation P620 и показывает преимущества восьми каналов памяти, в отличие от четырех. На самом деле один экземпляр Ryzen 9 5950X на самом деле быстрее, чем либо ни TELERIPPER, так и архитектура amd Zen 3 сохраняет хороший темп с P620 и 3990x на уровне 2x. При 4x нитокпоры решительно тянут. Небольшое усиление между 2x и 4X для 5950x показывает, что 4x является реалистичным пределом для потребительского процессора. StaxRip вылетает при настройке с 8 нитками в случае, если вы запускаете более четырех экземпляров на 5950X. Threadrippers не влияют на этот вопрос.

От 4x до 8x 3990x выбирает всего 1,25x производительность, а Lenovo ThinkStation P620 выигрывает 1.51x. Восемь каналов памяти позволяют 3995WX продолжить масштабирование, когда даже мощный 3990x работает из газа. Я хочу отметить, что Threadripper Ryzen 3990X на самом деле поддерживает более высокие часы в этом тесте, чем Threadripper Pro 3995WX в Lenovo ThinkStation P620. Это не тактовая скорость, что делает разницу, это пропускная способность памяти.

Тест AI измеряется в рамках в минуту. Мы ожидали, что производительность полностью определяется выбором ГПУ, поэтому представьте наш сюрприз, когда Ryzen 9 5950X превосходит Threadripper 3990x, когда оба были оснащены RTX 2080. TOPAZ был обновлен несколько раз, так как мы начали развивать этот тест, а Tracbench 0.2 Используйте обновленную версию приложения, но это было интересное и неожиданное развитие. Леново ThinkStation P620, как и ожидалось, легко выигрывает этот тест.

Наконец, тест преобразования FFMPEG объединяет кадры и аудио обратно в один видеофайл. P620 превосходит как Threadripper 3990x, так и 5950x на одной экземпляре Mark и сохраняют этот привод после этого. В отличие от транскодирования, падение между 5950X и другим процессором AMD является немедленным.

Масштабирование между двумя нитипользователями идентична на каждой измеренной точке. При восьми кодировках как 64-ядро процессора отчета о нагрузке ~ 95 процентов, а отсутствие улучшения между 6x и 8x экземплярами указывает, что не остается не так много запасов. Тот факт, что эти два системы одинаково, однако, указывает на то, что пропускная способность памяти не является ограничивающим фактором. Интересно увидеть, что Рызен 9 5950X все еще вешает вверх, даже если это не очень много. Переключение от 4X до 8x улучшает производительность на 7 процентов.

ThinkStation P620 - гигант, когда речь идет о транскодировании, где он не менее 1,84x быстрее, чем 3990x и 3.37x быстрее, чем Ryzen 9 5950X. Он поддерживает 2,6х свинца в AI Upscaling над 5950X, вежливо предоставлена ​​на скобу RTX 6000 Quadro карты, которые он несет. Производительность FFMPEG показала наименьшее преимущество для Threadripper Ryzen 3995WX.

В дополнение к Tracbench мы также сравнили две системы в SpecWorkStation 3.1.0.

! Функция (e, i, n, s) {var t = "infogreds", d = e.getelementsbytagname ("Script") [0]; если (окно [T] && Window [T]. Инициализированное) окно [T]. .Process && Window [t] .Process (); else is (! e.getelementbyyed (n)) {var o = e.createidelement ("Script"); o.async = 1, o.id = n, o.src = "https://e.infogram.com/js/dist/embed-loader-min.js",d.parentnode.insertbefore((,d)} }(Document,0,ОТВИЗЯТЬСЯ

SpecWorkStation предназначен для измерения производительности в приложениях рабочей станции, включая тесты GPU. Эта учетная запись для некоторых пробелов между нитей 3990x и TEDRIPPER PRO 3995WX на графике выше, но не все они.

Огромный разрыв производительности в науках о жизни не может быть объяснен исключительно на более высоких каналах памяти 3995WX, и в нашей конфигурации 3990X, возможно, может быть тонкость в нашей конфигурации 3990X, или особенность выполнения четырехканального потокового течения, который привел к тестированию 3995W, намного лучше Чем 3990x в подтестях лампса, где 3995WX был не менее 6,5x быстрее, чем 3990x. Разрывы в других категориях, как правило, объясняются Lenovo ThinkStation P620 Falling более быстрым хранением, графическим процессором или дополнительными четыреми каналами памяти, но в категории «Категория Life Cational Gwarfs».

Если мы удалим разрозненное воздействие этого подтеста и осмотрите 3990x по сравнению с подсчетом 3995WX с помощью подседеста, 3995WX превращаются в счет, которые находятся 0,92x - 2.15X быстрее, чем 3990x. Хотя он узко теряет несколько тестов из-за более быстрых часов 3990x, он выигрывает гораздо больше, чем теряет на добавлении дополнительной пропускной способности памяти.

Когда мы смотрим на тесты хранения, и мы убираем результаты хранения Nammd, чтобы быть перекошенным в аналогичной форме для теста процессора, SSD Samsung PM981 в Lenovo P620 - 1.28X быстрее, в совокупности, чем Pilot-e Mushkin, который мы использовали для нашего Threadripper 3990x Сравнение. С включенными результатами Nummd P620 - 1.37x быстрее. Обе системы используют диски PCIE 3.0 - мы видим влияние контроллера SSD, а не дополнительную пропускную способность, доступную через PCIE 4.0.

Lenovo Thinkstation P620 попадает в Pinnacle производительности рабочей станции

Threadripper Ryzen 3990X по-прежнему является одним из самых веселых процессоров, которые я когда-либо рассмотрел, частично для абсурдной радости отталкивать его на все ядро ​​4,3 ГГц снаружи во время полярного вихря, и частично, потому что просмотр 64 ядер RIP через рендеринг нагрузки Протокол, которые могут занять час или больше на восьмизерной чипе, это весело.

Если смотреть The Ryzen Threadripper 3990X, это весело, наблюдая за Lenovo ThinkStation P620 и The Ryzen Threadripper Pro 3995WX - это абсолютная сторона. 3995WX не всегда быстрее, чем 3990x - есть несколько мест, где на 4-6 процентов медленнее - но вы торгуете, что горсть небольших замедлений для улучшений производительности 1.4x - 2x в конкретных приложениях. Результаты, которые мы показали здесь, иллюстрируют важность познания вашей рабочей нагрузки - в соответствии с правильными обстоятельствами, Threadripper Ryzen 3995WX способен почти удвоить производительность Ryzen Threadripper 3990x. По неправильным, 3990x на 5-6 процентов быстрее, чем его более дорогим родным братом.

Что касается Tracbench, ожидайте увидеть его снова всплыть, в следующий раз у нас есть процессор для рассмотрения. Выступление P620 ThinkStation P620 в рабочей нагрузке Tracbench's Transcoding была удивительной. The Ryzen Teampripper Pro 3995WX ест нагрузки Transcode на завтрак, намного за пределы чего-либо даже тепленок Ryzen 3990x способен на.

Я думаю, что мы собираемся увидеть AI AI AI APSCALING в или выше качественных предложений TVEI в настоящее время в течение следующих пяти лет. В настоящее время два Turing GPU комбинированные производят ~ 5.5fps, но можно представить ампер удвоить этот базовый уровень и ударить 5,5FPS с одной картой. В этот момент нам нужно еще одно улучшение производительности 5x (я округлен, чтобы поставить какую-то прокладку на маржу). Учитывая, как быстро улучшилось производительность AI, это просто не сумасшедшая идея. ThinkStation P620 не демонстрирует будущее, мы никогда не увидим - просто ускоряя его прибытие немного.

Lenovo ThinkStation P620 является одним из самых мощных рабочих станций, охлажденных воздухом, которые могут купить деньги, и он предлагает увлекательный проблеск в будущее восстановления контента и высококачественным. Если вы посмотрели на Threadripper Ryzen Threadripper 3990x, но были обеспокоены его четырехканальным дизайном, ограниченным чипом, Threadripper Ryzen Pro 3995WX может быть именно то, что вы ищете.