Нова утиліта може подвоїти продуктивність AMD Threadripper 2990WX

32-ядерний процесор AMD, 2990WX, завжди був невизначеною пропозицією. Незважаючи на те, що в певних ситуаціях швидше, чіп зазнав регресії продуктивності в інших тестах і не завжди перевершує 16-ядерний Threadripper 2950X. Тепер існує утиліта CorePrio, яка може бути використана для відновлення більшої частини відсутньої продуктивності 2990WX під Windows 10.

Level1Techs опублікував велику доповідь у своєму дослідженні продуктивності на 2990WX. Початкове припущення, що перевантаження пропускної здатності пам'яті є причиною зниження загальної продуктивності, хоча і не є неправильним у всіх випадках, виявилося неповним. Рівень 1 виявив, що ті ж регресії продуктивності були присутні в випробуваному Epyc 7551, який мав вісім каналів пам'яті замість чотирьох Threadripper. Знову ж таки, продуктивність під Linux була прекрасною, але продуктивність у Windows була вражена. Але Level1 також виявив дивну поведінку, пов'язану зі зміною спорідненості процесора Windows, і як це вплинуло на загальне тестування продуктивності.

Те, що їх розслідування в кінцевому підсумку виявило, - це проблеми, пов'язані з тим, як певні програми переміщують робочі навантаження між ядрами в процесорах із NUMA з більш ніж одним NUMA-вузлом. Рівень 1 пише: "Якщо рекомендовано лише один вузол NUMA через" ідеальний процесор ", ядро Windows витрачає половину доступного часу процесора, просто перемішуючи нитки між ядрами."
Вони продовжують:
Ось цікавий поворот: якщо у вас є тільки один інший вузол NUMA - вікна, здається, повертаються до того, щоб дозволити ниткам встановити себе на другому вузлі NUMA… Це, швидше за все, пов'язане з виправленням з Microsoft для 1 або 2 гнізд Extreme Core Count (XCC) Xeons, в яких фізичний процесор Xeon має два numa-вузли. У минулому (з Xeon V4 і, можливо, V3), один з цих NUMA вузлів не має доступу до пристроїв вводу / виводу (але має доступ до пам'яті через кільцеву шину).
Якщо це правда, то, щоб переконатися, що цей тип процесу залишається на "ідеальному процесорі" в тому ж сокеті, не знає, що робити, коли існує більше одного вузла NUMA в одному пакеті, щоб "вийти з ладу" »До.
Рішення для цього - утиліта з назвою CorePrio:

CorePrio вирішує цю проблему і дозволяє потокам планувати рівномірно по всіх процесорах, а не Windows, витрачаючи весь свій час на спроби перетасувати їх по всій системі. Схоже, що причина для різких регресій продуктивності 2990WX була викликана принаймні частково тим, що Windows витрачала набагато більше часу на переміщення робочих навантажень від CPU до CPU, ніж це коли-небудь витрачало на виконання роботи. Очевидно, що це не підвищить продуктивність Threadripper в додатках, де вона вже добре масштабується, але вона повинна виправити регресії продуктивності в декількох додатках.
Не зрозуміло, чи підсистема пам'яті все ще до цього причетна. Якщо потоки неправильно розташовані на неправильному вузлі NUMA, можливо, доступ до пам'яті виконується в основному або повністю через один контролер пам'яті. Це пояснює, чому восьмиканальний Epyc в режимі NUMA дає таку ж продуктивність (з урахуванням тактової частоти) як чотириканальний TR. Можливо, існують програми, які не мають достатнього масштабу в конфігурації NUMA 2990WX з причин, не пов'язаних з недоліками планувальника Windows 10. \ t
Повна версія помилки та її потенційні виправлення ще не були повністю розгорнуті, якщо "виправлення невідомого випуску Windows" не було підставою вище. Майкрософт і AMD ще не опублікували офіційних відповідей, і незрозуміло, якими є терміни для виправлення цієї проблеми за допомогою оновлення ОС. Але якщо ви власник 2990WX або зацікавилися стати одним, це може змінити обчислення того, чи варто вкладати чіп - за умови, що ви, звичайно, дуже особливий клієнт. Середні і навіть не дуже середні гравці не повинні застосовуватися, оскільки чіпи, подібні до 2990WX, грають у дуже рознесеному просторі.
Читати далі

Зразок астероїда OSIRIS-REx НАСА просочується у космос
NASA повідомляє, що зонд схопив з астероїда стільки реголіту, що він витікає з колектора. Зараз команда працює над тим, щоб визначити, як найкраще уберегти дорогоцінний вантаж від втечі.

Огляд: Oculus Quest 2 може стати підказкою для масового прийняття VR
Oculus Quest 2 тепер доступний, і це покращення в порівнянні з оригіналом у всіх важливих аспектах. І все-таки це на 100 доларів дешевше, ніж останній реліз. Провівши деякий час з Quest 2, я вважаю, що ми могли б озирнутися на нього як на гарнітуру, яка нарешті зробила VR доступною для основних споживачів.

Захистіть свою конфіденційність в Інтернеті за допомогою 5 найкращих мереж VPN
Зараз інвестування в VPN - це розумний вибір, але можливостей величезна. Щоб трохи звузити ситуацію, ми зібрали п’ять наших улюблених споживчих послуг.

НАСА створило колекцію моторошних космічних звуків на Хелловін
Останній випуск даних NASA перетворює сигнали з-поза Землі в моторошні звуки, які, безсумнівно, викликають озноб у вашій хребті.