Введення Tracbench, новий Transcoding Transcoding Transcoding

Введення Tracbench, новий Transcoding Transcoding Transcoding

Трохи більше року тому я почав експериментувати з відновленням відео та ai високопоставленим для мого глибокого простору дев'яти висококласного проекту. Сьогодні я хотів би поговорити про тест, який я побудував як частину цих зусиль, і які цікаві речі це може розповісти нам про продуктивність ультра-високої робочої станції. Такі дискусії не дуже веселяться без практичного обладнання для гри, тому ми також будемо вивчати, як продуктивність у наших нових тестових масштабах між AMD Ryzen Regripper 3990X з 64 ядрами та чотирма каналами RAM та Ryzen Threadripper Pro 3995WX-обладнаний Lenovo ThinkStation P620 Workstation з тією ж 64 ядра та вісім каналів оперативної пам'яті.

Введення Tracbench, новий Transcoding Transcoding Transcoding

Попередження Spoiler: одна з причин, з якими я написав цю статтю, полягає в тому, щоб продемонструвати, наскільки багато вогневої системи сучасного верхнього кінця X86 не може призвести до технологічних навантажень для передачі засобів масової інформації. Загальна якість висококваліфікованої якості продовжує вдосконалюватися, і шанувальники мого глибокого простору дев'яти висококласного проекту повинні знати, що я маю більше сказати про це найближчим часом.

У минулому я покладався на ручний звук, щоб захопити транскодування, але є більш гнучкі інструменти, доступні з більш широким спектром функцій. Я експериментував з використанням ручного гальма як крок обробки в моїх дослідженнях за останні 15 місяців, перш ніж вирішити інші інструменти були кращими для того, що я хотів зробити. Дизайн Тракбенча - перші чотири букви підтримують для транскодування, AI, і конверсії - відображає те, що я дізнався про масштабування цих робочих навантажень у великому масиві ядер.

Tracbench 0.1 використовує марнотратну кадру SD як початкове джерело. Хоча AI масштабування додатків, таких як топаз, здатні до ноутбуків 720p або 1080p, 360p та 480p кадри легше обробляються за розумною кількістю часу.

Транскодування: Цей крок використовує Staxrip як передній кінець для avisynth і deinterlaces кадри з використанням qtgmc. Tracbench 0.1 використовує ті ж самі налаштування, опубліковані тут і будується навколо Staxrip 2.1.3.0 з Avisynth + 3.6.1. Staxrip працює паралельно за допомогою декількох екземплярів такої ж застосування. Staxrip налаштовано, щоб дозволити до восьми паралельних процесів за приклад застосування та попередження (8) використовували в кожному скрипті Avisynth. Ми перевіряємо до 16 одночасних кодів для завантаження всіх 128 ниток Ryzen Threadripper 3990X та Threadripper Pro 3995WX. RYZEN 9 5950X не може підтримувати так багато паралельних кодів і вирівнює на набагато нижчим максимуму.

Ai upscaling. У версії 0.1 цей крок обробляється TOPAZ 1.5.3. Це стара версія програми, яка не підтримує RTX 3000 або RDNA2 GPUS. Це не проблема для нас сьогодні, тому що Quadro RTX 6000 карток всередині Lenovo Thinkstation P620 є заснованими на Тюрінг. Майбутні версії тесту будуть оновлюватися до останньої версії TOPAZ. Багатоцільове тестування на Thinkstation P620 обробляється за допомогою одного екземпляра застосування на кожному GPU.

Конвертація: Останній крок - Перетворення високопоставлених кадрів та оригінальний звук назад у фінальне відео. Випускні кадри, а потім рекомбінувати їх за допомогою інструменту, як FFMPEG, дає чудову якість, щоб просто вивести файл MP4 через TOPAZ. Tracbench 0.1 використовує FFMPEG GIT-2020-08-28-CCC7120 та Libx264 для кодування H.264. Майбутні версії включатимуть тестування в H.265.

Ми можемо продовжувати використовувати ручний гальма для простих тестування, але ручний гальма не така корисна для обробки фронтової відео, як Avisynth. Avisynth - це командного відеоредактора, який пропонує широкий спектр фільтрів для трансформації та редагування відео різними способами. Staxrip служить перед ним фронт.

Lenovo Thinkstation P620 був ідеальним тестом для побудови цього еталону. 3995WX всередині системи є верхній частині AMD Ryzen Threadripper Pro CPU. Він має трохи нижчі годинники, ніж 3990x, але він пропонує двічі максимальну пропускну здатність пам'яті. 3990x має лише один канал пам'яті на 16 ядер, а 3995WX має два.

Введення Tracbench, новий Transcoding Transcoding Transcoding

Там є компроміс між Ryzen Threadripper 3995WX та ThemeRipper 3990x, з останнім, що пропонує дуже трохи більш швидкому швидкості, але різко, меншу пропускну здатність пам'яті. Ми побачимо, чи достатньо різниця, щоб мати значення у наших тестах - і у нас є кілька додаткових результатів між двома системами за межами цього тесту.

Замість того, щоб спробувати зробити ці три системи, наскільки це можливо, я свідомо дозволив їхніми конфігураціями відрізнятися. Ми розглядаємо три різних зусилля, щоб побудувати високотехнологічну робочу станцію, по суті. Ryzen 9 5950x балансує новий 16-ядерний процесор проти старшого GPU з 2018 року. Різниця Ryzen 3990x зберігає такий же GPU, але збільшує кількість ядер та загальної смуги пам'яті різко. Обидва ці системи вибирають менш дорогим, більші М.2 SSD, з 2 Тб потужністю порівняно з швидкістю Samsung PM981 Polaris Drive, при 1TB. Нарешті, Lenovo Thinkstation P620 подвоює пропускну здатність пам'яті знову і додає другий GPU. Кожна з цих систем може бути справедливо називатися системою робочої станції, але вони роблять різні компроміси. Ми побачимо, як ці компроміс впливає на ефективність.

До речі, 3990x працює DDR4-2666, тому що мій процесор, який колись побіг у DDR4-3600 без проблем, тепер відмовляється від годинника вище 2666. Неодноразово переробити оперативну пам'ять, так і КПУ не вплинуло на це обмеження, а розслаблююча Рам-час до смішного ступеня не допомагала системі розмістити вищу оперативну оперативну годинник.

Lenovo Thinkstation P620 Workstation

Lenovo Thinkstation P620 - це справді хороший шматок комплекту з кількома незвичайними звичками. Він має дуже довгий час завантаження (~ 81 секунди), і він випромінює два довгих позов, а потім три короткі звукові сигнали, перш ніж настане монітор. Це може бути пов'язано з деяким аспектом конфігурації Dual Nvidia Quadro RTX 6000, оскільки дисплей не ініціалізується, доки Windows 10 не витягує робочий стіл. Стабільність системи була відмінною у будь-який час.

Панель CASE навісна і піднімається безпосередньо від системи. Внутрішній макет ThinkStation P620 добре розроблений, хоча видалення другого GPU може бути складним залежно від того, наскільки велика рука. Модулі передніх панелей призначені для адаптації до різних типів пристроїв залежно від того, що вам потрібно підключити.

Я збираюся запозичити фотографію з нашої сестри Сайт PCMAG огляд ThinkStation P620, оскільки він показує всередині шасі без встановлених графічних карток:

Введення Tracbench, новий Transcoding Transcoding Transcoding

Ось більш жорсткий кут нашої мислення P620, встановлений свої графічні карти.

Введення Tracbench, новий Transcoding Transcoding Transcoding

Джерело живлення чудово. Це легко найменший блок живлення 1KW, який я коли-небудь бачив, і це оцінено 80 плюс платини. Він підключається безпосередньо до материнської плати за допомогою краю, видимий нижче:

Введення Tracbench, новий Transcoding Transcoding Transcoding

Я розірваний на цьому аспекті дизайну Thinkstation P620. Джерело живлення - це добре вбудована одиниця, а вона безпосередньо до материнської плати без потреби в Clunky 24-контактному кабелі ATX. Є вторинні кабелі PCIE, встановлені на краю материнської плати, що подорожують з материнської плати до GPUS. Це об'єктивно краща система для доставки потужності, але якщо ваше джерело живлення вмираєш, ви будете говорити з Леново про заміну.

Введення Tracbench, новий Transcoding Transcoding Transcoding

Активне охолодження для оперативних слотів. Напевно, не найгірша ідея, враховуючи, наскільки щільно упаковані речі.

Введення Tracbench, новий Transcoding Transcoding Transcoding

Система охолодження трохи незвичайна, але вона зберігає систему стабільною, навіть під стійким повним навантаженням. Ми підкреслюємо, протестували систему, запустивши 16 вантажних навантажень та двох робочих навантажень AI одночасно. Споживання електроенергії на стіні HIT 800 Вт, але система залишалася стабільною під восьмигодинним тестом навантаження. Шум вентилятора з обох GPU, так і процесор одночасно був значним - я не хотів би запустити вежу, якщо він сидів поруч з моєю головою - але не достатньо, щоб бути побоюванням, якщо машина сиділа під столом.

Тестові нотатки

Lenovo Thinkstation P620 Dual RTX 6000 GPUS гарантує, що він виграє тест AI. Точка цього порівняння полягає у тому, щоб показати потенційну посилення продуктивності при поступовій формі споживчої картки з 2018 року до пари карт вищого закінчення робочих місць. Вся точка Tracbench полягає в тому, що вона може масштабувати з звичайного споживача до високоякісних робочих станцій, тому має сенс захопити ряд точок даних (і цінових тегів).

Результати сьогодні представлені лише для систем AMD. Tracbench 0.1 був розроблений на апаратному комплексі AMD, і я не брав доступу до виду Dual-Socket Xeon Systems, які конкурують з Lenovo P620 на Core Core. Майбутні ітерації еталону також включатимуть інформацію про масштабування платформи Intel через Rocket Lake, каскадне озеро та системи Lower-Core AMD.

Результати тракментів

Транскодування, AI та кроки комбінації кожен показують різні моделі продуктивності, тому ми обговорюємо їх окремо.

! Функція (e, i, n, s) {var t = "informongembeds", d = e.getlelementbytagname ("сценарій") [0]; якщо (вікно [t] & & вікно [t] .initialized) вікно [t] .Process & & вікно [t] .процесу (); ще, якщо (! e.getleementById (n)) {var o = e.createelement ("скрипт"); o.async = 1, O.ID = N, O.SRC = "https://e.infogram.com/js/dist/embed-loader-min.js",d.parentnode.insertbefore (o ads )(document,0,"infogram-async");

Транскодування є величезною перемогою для ThinkStation P620 і показує переваги восьми каналів пам'яті, на відміну від чотирьох. Усього, що Ryzen 9 5950x насправді швидше, ніж архітектура Thergripper, так і AMD Zen 3 зберігає хороший темп з P620 та 3990X на 2-му рівні. На 4x, нитки тягнуть рішуче. Невеликий приріст між 2x і 4x для 5950X показує, що 4x є реалістичною межею для CPU споживача. Staxrip аварії під час налаштування з 8 потоками на екземпляр, якщо ви запускаєте більше чотирьох екземплярів на 5950х. Це питання не впливає на цю проблему.

Від 4x до 8x, 3990x підбирає лише 1,25x продуктивність, а Lenovo Thinkstation P620 отримує 1,51x. Вісім каналів пам'яті дозволяють 3995WX продовжувати масштабування, коли навіть могутній 3990x вичерпається з газу. Я хочу відзначити, що Ryzen Threadripper 3990x фактично підтримує вищі годинники в цьому тесті, ніж Thergripper Pro 3995WX у Lenovo Thinkstation P620. Це не тактована швидкість, що робить різницю, це пропускна здатність пам'яті.

Тест AI вимірюється в рамках за хвилину. Ми очікувала продуктивність, щоб бути цілком визначеним вибором GPU, тому уявіть собі наш сюрприз, коли Ryzen 9 5950x перевершив термін, коли обидва вони були обладнані RTX 2080. TOPAZ оновлено кілька разів, оскільки ми почали розробляти цей тест, а Tracbench 0.2 буде Використовуйте оновлену версію програми, але це було цікавим та несподіваним розвитком. Lenovo Thinkstation P620, як очікувалося, легко виграє цей тест.

Нарешті, тест конвертації FFMPEG об'єднує кадри та аудіо назад у єдиний відеофайл. The P620 перевершує як thergripper 3990x, так і 5950x на знаку одноразової речовини та утримує цей привід. На відміну від транскодування, випадок між 5950x та іншим КПУ AMD є негайним.

Масштабування між двома стрічками таблетки ідентична при кожній вимірюваній точці. У восьми кодів, обидва 64-основний CPU звітують ~ 95 відсотків навантаження, а відсутність поліпшення між 6-кратними та 8х екземплярами вказує, що там не залишилося, щоб викреслити. Той факт, що обидва шкала систем однаково вказує на те, що пропускна здатність пам'яті не є обмежувальним чинником. Цікаво бачити, що RYZEN 9 5950X все ще масштає вгору, навіть якщо це не дуже. Переміщення з 4x до 8x покращує продуктивність на 7 відсотків.

ThinkStation P620 є гігантським, коли мова йде про транскодування, де це не менше 1,84x швидше, ніж 3990x і 3.37x швидше, ніж Ryzen 9 5950x. Він підтримує 2,6-х свинцю в АІ, що перевищує 5950х, люб'язно надано фігурні квоти RTX 6000 Quadro Cards. Продуктивність FFMPEG показала найменшу перевагу для Ryzen Threadripper 3995WX.

На додаток до Tracbench, ми також порівнювали дві системи в спеціальній робочій стадії 3.1.0.

! Функція (e, i, n, s) {var t = "informongembeds", d = e.getlelementbytagname ("сценарій") [0]; якщо (вікно [t] & & вікно [t] .initialized) вікно [t] .Process & & вікно [t] .процесу (); ще, якщо (! e.getleementById (n)) {var o = e.createelement ("скрипт"); o.async = 1, O.ID = N, O.SRC = "https://e.infogram.com/js/dist/embed-loader-min.js",d.parentnode.insertbefore (o ads )(document,0,"infogram-async");

Спеціальна виставка призначена для вимірювання продуктивності у робочих станціях, включаючи тести GPU. Це призводить до деяких прогалин між потоком 3990X та Threadripper Pro 3995WX на графіку вище, але не всі вони.

Величезний розрив у галузі життя наук не може бути пояснений виключно вищими каналами пам'яті 3995WX, і там може бути тонкість у нашій конфігурації 3990x, або особливість запуску чотириканального терміну, що призвела до тестування 3995WX, набагато краще Чим 3990x в санкціонувальних мережах, де 3995WX було не менше 6,5x швидше, ніж 3990x. Продовження в інших категоріях, як правило, пояснюються Lenovo Thinkstation P620 Fielding Faster Storage, GPUS або додаткові чотири канали пам'яті, але категорія Life Sciences Gap карликів їх усіх.

Якщо ми вилучимо розрізненний вплив цього найтоншого та вивчити 3990x, що виповниться 3995WX Subtest, 3995WX перетворюється в балів, які становлять 0,92x - 2.15x швидше, ніж 3990x. Хоча він вузько втрачає декілька тестів через швидший годинник 3990x, він виграє набагато більше, ніж він втрачає на додавання більшої пропускної здатності пам'яті.

Коли ми розглядаємо тестування на зберігання, і ми видаляємо результати зберігання NAMMD для того, щоб бути перекошеним способом тесту на тестування процесора, Samsung PM981 SSD у Lenovo P620 становить 1,28x швидше, в сукупності, ніж Mushkin Pilot-E ми використовували для нашого Порівняння різьблення 3990x. Завдяки включеним результатам NAMMD, швидше, P620 становить 1,37x. Обидва системи використовують диски PCIE 3.0 - ми бачимо вплив контролера SSD, а не додаткової пропускної здатності, доступної через PCIE 4.0.

Lenovo Thinkstation P620 потрапляє в Pinnacle з робочої станції

Ryzen Threadripper 3990X - це ще один з найцікавіших процесорів, який я коли-небудь переглянув, частково для абсурдної радості, натиснувши його на все-сердечний 4,3 ГГц на вулиці під час полярного вихору, а частково тому, що спостерігаючи за 64 сердечниць хвилини, які можуть зайняти годину або більше на восьмисному чіпі - це весело.

Якщо переглядати Ryzen Threadripper 3990x це весело, спостерігаючи за Lenovo Thinkstation P620, а Ryzen Threadripper Pro 3995WX є абсолютною партією. 3995WX не завжди швидше, ніж 3990x - є декілька місць, де це 4-6 відсотків повільніше - але ви торгуєте, що жменька невеликих уповільнювачів для 1.4x - 2x покращення продуктивності в конкретних додатках. Результати, які ми показали тут, ілюструють важливість знання вашого робочого навантаження - за правильними обставинами, Ryzen Threadripper 3995WX здатний майже подвоєння продуктивності Ryzen Regripper 3990x. Під неправильними, 3990x становить 5-6 відсотків швидше, ніж його дорожче брат.

Що стосується Tracbench, очікуйте, що він знову з'явиться, наступного разу у нас є CPUS для перегляду. Продуктивність ThinkStation P620 в робочому навантаженні Tracbench була дивовижною. Ryzen Threadripper Pro 3995WX їсть автомобільні навантаження на сніданок, далеко за межами чогось навіть Ryzen Threadripper 3990X здатний.

Я думаю, що ми побачимо в режимі реального часу Ai, що підтримується або вище якості TVEI наразі протягом наступних п'яти років. В даний час два Turing GPUS комбіновані продукти ~ 5.5fpps, але можна уявити собі, що амперд подвоїв, що базовий рівень і удару 55FPS з однією карткою. У той момент нам потрібна ще 5x покращення продуктивності (я округлюся, щоб покласти деяку підкладку на маржі). Враховуючи, наскільки швидко продуктивність AI покращилася, це просто не божевільна ідея. ThinkStation P620 не демонструє майбутнє, ми ніколи не побачимо - просто прискорюючи його прибуття трохи.

Lenovo Thinkstation P620 є одним з найпотужніших повітряних охолоджених робочих станцій, які можуть купувати, і він пропонує захоплюючий погляд у майбутнє відновлення контенту та високопоставленого. Якщо ви подивилися на Ryzen Threadripper 3990x, але стурбовані його квадрочним дизайном обмеженим чіпом, Ryzen Threadripper Pro 3995WX може бути саме те, що ви шукаєте.

Читати далі

Нова серія Radeon RX 6000 від AMD оптимізована для бойового ампера
Нова серія Radeon RX 6000 від AMD оптимізована для бойового ампера

AMD сьогодні представила свою серію RX 6000. Вперше з моменту придбання ATI в 2006 році, існуватимуть певні переваги в роботі графічних процесорів AMD на платформах AMD.

Нові відомості про Intel Rocket Lake: Сумісність із зворотною стороною, Xe Graphics, Cypress Cove
Нові відомості про Intel Rocket Lake: Сумісність із зворотною стороною, Xe Graphics, Cypress Cove

Intel опублікувала трохи більше інформації про Rocket Lake та його 10-нм процесор, який було перенесено назад на 14 нм.

RISC-V навшпиньки до основного потоку завдяки платформі розробників SiFive, високопродуктивний процесор
RISC-V навшпиньки до основного потоку завдяки платформі розробників SiFive, високопродуктивний процесор

RISC V продовжує проникати на ринок, цього разу завдяки дешевшій та повнофункціональнішій тестовій материнській платі.

Intel випускає нові мобільні графічні процесори Xe Max для творців вмісту початкового рівня
Intel випускає нові мобільні графічні процесори Xe Max для творців вмісту початкового рівня

Intel випустила новий споживчий мобільний графічний процесор, але він має дуже конкретний варіант використання, принаймні зараз.