Нова утиліта може подвоїти продуктивність AMD Threadripper 2990WX

Нова утиліта може подвоїти продуктивність AMD Threadripper 2990WX

32-ядерний процесор AMD, 2990WX, завжди був невизначеною пропозицією. Незважаючи на те, що в певних ситуаціях швидше, чіп зазнав регресії продуктивності в інших тестах і не завжди перевершує 16-ядерний Threadripper 2950X. Тепер існує утиліта CorePrio, яка може бути використана для відновлення більшої частини відсутньої продуктивності 2990WX під Windows 10.

Доступ до пам'яті на 2990WX.
Доступ до пам'яті на 2990WX.

Level1Techs опублікував велику доповідь у своєму дослідженні продуктивності на 2990WX. Початкове припущення, що перевантаження пропускної здатності пам'яті є причиною зниження загальної продуктивності, хоча і не є неправильним у всіх випадках, виявилося неповним. Рівень 1 виявив, що ті ж регресії продуктивності були присутні в випробуваному Epyc 7551, який мав вісім каналів пам'яті замість чотирьох Threadripper. Знову ж таки, продуктивність під Linux була прекрасною, але продуктивність у Windows була вражена. Але Level1 також виявив дивну поведінку, пов'язану зі зміною спорідненості процесора Windows, і як це вплинуло на загальне тестування продуктивності.

Дані та графік за рівнем1.
Дані та графік за рівнем1.

Те, що їх розслідування в кінцевому підсумку виявило, - це проблеми, пов'язані з тим, як певні програми переміщують робочі навантаження між ядрами в процесорах із NUMA з більш ніж одним NUMA-вузлом. Рівень 1 пише: "Якщо рекомендовано лише один вузол NUMA через" ідеальний процесор ", ядро ​​Windows витрачає половину доступного часу процесора, просто перемішуючи нитки між ядрами."

Вони продовжують:

Ось цікавий поворот: якщо у вас є тільки один інший вузол NUMA - вікна, здається, повертаються до того, щоб дозволити ниткам встановити себе на другому вузлі NUMA… Це, швидше за все, пов'язане з виправленням з Microsoft для 1 або 2 гнізд Extreme Core Count (XCC) Xeons, в яких фізичний процесор Xeon має два numa-вузли. У минулому (з Xeon V4 і, можливо, V3), один з цих NUMA вузлів не має доступу до пристроїв вводу / виводу (але має доступ до пам'яті через кільцеву шину).

Якщо це правда, то, щоб переконатися, що цей тип процесу залишається на "ідеальному процесорі" в тому ж сокеті, не знає, що робити, коли існує більше одного вузла NUMA в одному пакеті, щоб "вийти з ладу" »До.

Рішення для цього - утиліта з назвою CorePrio:

Нова утиліта може подвоїти продуктивність AMD Threadripper 2990WX

CorePrio вирішує цю проблему і дозволяє потокам планувати рівномірно по всіх процесорах, а не Windows, витрачаючи весь свій час на спроби перетасувати їх по всій системі. Схоже, що причина для різких регресій продуктивності 2990WX була викликана принаймні частково тим, що Windows витрачала набагато більше часу на переміщення робочих навантажень від CPU до CPU, ніж це коли-небудь витрачало на виконання роботи. Очевидно, що це не підвищить продуктивність Threadripper в додатках, де вона вже добре масштабується, але вона повинна виправити регресії продуктивності в декількох додатках.

Не зрозуміло, чи підсистема пам'яті все ще до цього причетна. Якщо потоки неправильно розташовані на неправильному вузлі NUMA, можливо, доступ до пам'яті виконується в основному або повністю через один контролер пам'яті. Це пояснює, чому восьмиканальний Epyc в режимі NUMA дає таку ж продуктивність (з урахуванням тактової частоти) як чотириканальний TR. Можливо, існують програми, які не мають достатнього масштабу в конфігурації NUMA 2990WX з причин, не пов'язаних з недоліками планувальника Windows 10. \ t

Повна версія помилки та її потенційні виправлення ще не були повністю розгорнуті, якщо "виправлення невідомого випуску Windows" не було підставою вище. Майкрософт і AMD ще не опублікували офіційних відповідей, і незрозуміло, якими є терміни для виправлення цієї проблеми за допомогою оновлення ОС. Але якщо ви власник 2990WX або зацікавилися стати одним, це може змінити обчислення того, чи варто вкладати чіп - за умови, що ви, звичайно, дуже особливий клієнт. Середні і навіть не дуже середні гравці не повинні застосовуватися, оскільки чіпи, подібні до 2990WX, грають у дуже рознесеному просторі.

Читати далі

AMD Коментарі на Threadripper 2990WX питання планування
AMD Коментарі на Threadripper 2990WX питання планування

AMD наважувався на проблеми з продуктивністю, які заважали 3290-ядерному процесору Threadripper 2990WX.