Нова утиліта може подвоїти продуктивність AMD Threadripper 2990WX

Нова утиліта може подвоїти продуктивність AMD Threadripper 2990WX

32-ядерний процесор AMD, 2990WX, завжди був невизначеною пропозицією. Незважаючи на те, що в певних ситуаціях швидше, чіп зазнав регресії продуктивності в інших тестах і не завжди перевершує 16-ядерний Threadripper 2950X. Тепер існує утиліта CorePrio, яка може бути використана для відновлення більшої частини відсутньої продуктивності 2990WX під Windows 10.

Доступ до пам'яті на 2990WX.
Доступ до пам'яті на 2990WX.

Level1Techs опублікував велику доповідь у своєму дослідженні продуктивності на 2990WX. Початкове припущення, що перевантаження пропускної здатності пам'яті є причиною зниження загальної продуктивності, хоча і не є неправильним у всіх випадках, виявилося неповним. Рівень 1 виявив, що ті ж регресії продуктивності були присутні в випробуваному Epyc 7551, який мав вісім каналів пам'яті замість чотирьох Threadripper. Знову ж таки, продуктивність під Linux була прекрасною, але продуктивність у Windows була вражена. Але Level1 також виявив дивну поведінку, пов'язану зі зміною спорідненості процесора Windows, і як це вплинуло на загальне тестування продуктивності.

Дані та графік за рівнем1.
Дані та графік за рівнем1.

Те, що їх розслідування в кінцевому підсумку виявило, - це проблеми, пов'язані з тим, як певні програми переміщують робочі навантаження між ядрами в процесорах із NUMA з більш ніж одним NUMA-вузлом. Рівень 1 пише: "Якщо рекомендовано лише один вузол NUMA через" ідеальний процесор ", ядро ​​Windows витрачає половину доступного часу процесора, просто перемішуючи нитки між ядрами."

Вони продовжують:

Ось цікавий поворот: якщо у вас є тільки один інший вузол NUMA - вікна, здається, повертаються до того, щоб дозволити ниткам встановити себе на другому вузлі NUMA… Це, швидше за все, пов'язане з виправленням з Microsoft для 1 або 2 гнізд Extreme Core Count (XCC) Xeons, в яких фізичний процесор Xeon має два numa-вузли. У минулому (з Xeon V4 і, можливо, V3), один з цих NUMA вузлів не має доступу до пристроїв вводу / виводу (але має доступ до пам'яті через кільцеву шину).

Якщо це правда, то, щоб переконатися, що цей тип процесу залишається на "ідеальному процесорі" в тому ж сокеті, не знає, що робити, коли існує більше одного вузла NUMA в одному пакеті, щоб "вийти з ладу" »До.

Рішення для цього - утиліта з назвою CorePrio:

Нова утиліта може подвоїти продуктивність AMD Threadripper 2990WX

CorePrio вирішує цю проблему і дозволяє потокам планувати рівномірно по всіх процесорах, а не Windows, витрачаючи весь свій час на спроби перетасувати їх по всій системі. Схоже, що причина для різких регресій продуктивності 2990WX була викликана принаймні частково тим, що Windows витрачала набагато більше часу на переміщення робочих навантажень від CPU до CPU, ніж це коли-небудь витрачало на виконання роботи. Очевидно, що це не підвищить продуктивність Threadripper в додатках, де вона вже добре масштабується, але вона повинна виправити регресії продуктивності в декількох додатках.

Не зрозуміло, чи підсистема пам'яті все ще до цього причетна. Якщо потоки неправильно розташовані на неправильному вузлі NUMA, можливо, доступ до пам'яті виконується в основному або повністю через один контролер пам'яті. Це пояснює, чому восьмиканальний Epyc в режимі NUMA дає таку ж продуктивність (з урахуванням тактової частоти) як чотириканальний TR. Можливо, існують програми, які не мають достатнього масштабу в конфігурації NUMA 2990WX з причин, не пов'язаних з недоліками планувальника Windows 10. \ t

Повна версія помилки та її потенційні виправлення ще не були повністю розгорнуті, якщо "виправлення невідомого випуску Windows" не було підставою вище. Майкрософт і AMD ще не опублікували офіційних відповідей, і незрозуміло, якими є терміни для виправлення цієї проблеми за допомогою оновлення ОС. Але якщо ви власник 2990WX або зацікавилися стати одним, це може змінити обчислення того, чи варто вкладати чіп - за умови, що ви, звичайно, дуже особливий клієнт. Середні і навіть не дуже середні гравці не повинні застосовуватися, оскільки чіпи, подібні до 2990WX, грають у дуже рознесеному просторі.

Читати далі

Захистіть свою конфіденційність в Інтернеті за допомогою 5 найкращих мереж VPN
Захистіть свою конфіденційність в Інтернеті за допомогою 5 найкращих мереж VPN

Зараз інвестування в VPN - це розумний вибір, але можливостей величезна. Щоб трохи звузити ситуацію, ми зібрали п’ять наших улюблених споживчих послуг.

Огляд: Oculus Quest 2 може стати підказкою для масового прийняття VR
Огляд: Oculus Quest 2 може стати підказкою для масового прийняття VR

Oculus Quest 2 тепер доступний, і це покращення в порівнянні з оригіналом у всіх важливих аспектах. І все-таки це на 100 доларів дешевше, ніж останній реліз. Провівши деякий час з Quest 2, я вважаю, що ми могли б озирнутися на нього як на гарнітуру, яка нарешті зробила VR доступною для основних споживачів.

Нові відомості про Intel Rocket Lake: Сумісність із зворотною стороною, Xe Graphics, Cypress Cove
Нові відомості про Intel Rocket Lake: Сумісність із зворотною стороною, Xe Graphics, Cypress Cove

Intel опублікувала трохи більше інформації про Rocket Lake та його 10-нм процесор, який було перенесено назад на 14 нм.

AMD може дозволити користувацькі картки RX 6900 XT, стартовий запас може бути обмежений
AMD може дозволити користувацькі картки RX 6900 XT, стартовий запас може бути обмежений

Ходять чутки, що Nvidia, можливо, не єдина компанія, яка стикається з дефіцитом виробництва у цей святковий сезон. Графічні процесори високого класу взагалі може бути дуже важко знайти.