Новая утилита может удвоить производительность AMD Threadripper 2990WX
32-ядерный процессор AMD 2990WX Threadripper всегда был чем-то вроде неопределенного предложения. Несмотря на то, что в некоторых сценариях он, несомненно, быстр, в других тестах отмечен резкий спад производительности, и он не всегда превосходит 16-ядерный Threadripper 2950X. Теперь есть утилита CorePrio, которую можно использовать для восстановления большей части недостающей производительности 2990WX в Windows 10.
Level1Techs опубликовала обширный отчет о своих исследованиях производительности на 2990WX. Первоначальное предположение о том, что перегрузка пропускной способности памяти ответственна за снижение общей производительности, хотя и не во всех случаях неверно, оказалось неполным. Уровень 1 обнаружил, что такие же регрессии производительности присутствовали в тестируемом Epyc 7551, который имел восемь каналов памяти вместо четырех в Threadripper. Опять же, производительность в Linux была хорошей, но производительность в Windows была подорвана. Но Level1 также обнаружил странное поведение, связанное с изменением сродства процессоров Windows, и как это повлияло на общее тестирование производительности.
В конечном итоге их исследование выявило проблемы с тем, как определенные приложения перемещают рабочие нагрузки между ядрами в процессорах с поддержкой NUMA с более чем одним узлом NUMA. Уровень 1 пишет: «Когда через« идеальный ЦП »рекомендуется только один узел NUMA, ядро Windows тратит половину доступного времени ЦП, просто перетасовывая потоки между ядрами».
Они продолжают:
Вот интересный момент: если у вас есть только один ДРУГОЙ узел NUMA - кажется, что окна возвращаются к тому, что потоки могут устанавливать себя на втором узле NUMA… Это, скорее всего, связано с исправлением ошибок от Microsoft для 1 или 2 сокетов Extreme Core Count (XCC) Xeons, где физический процессор Xeon имеет два узла numa. В прошлом (с Xeon V4 и, возможно, V3) один из этих узлов NUMA не имел доступа к устройствам ввода-вывода (но имел доступ к памяти через кольцевую шину).
Если это так, то этот обходной путь, гарантирующий, что процесс этого типа остается на «идеальном процессоре» в одном сокете, не имеет представления о том, что делать, если в одном пакете имеется более одного другого узла NUMA для «отработки отказа». ”К.
Решением этой проблемы является утилита с именем CorePrio:
CorePrio решает эту проблему и позволяет равномерно распределять потоки между процессорами, а не Windows, тратя все свое время, пытаясь перетасовать их через кристалл. Похоже, что причина резкого снижения производительности с 2990WX была вызвана, по крайней мере частично, тем, что Windows тратила гораздо больше времени на перемещение рабочих нагрузок с ЦП на ЦП, чем когда-либо фактически выполняла работу. Очевидно, что это не повысит производительность Threadripper в приложениях, где он уже хорошо масштабирован, но это должно исправить регрессию производительности во многих приложениях.
Пока не ясно, вовлечена ли подсистема памяти в это. Если потоки неправильно распределены на неправильном узле NUMA, возможно, что доступ к памяти осуществляется в основном или полностью через один контроллер памяти. Это объясняет, почему восьмиканальный Epyc в режиме NUMA дает такую же производительность (с учетом тактовой частоты), что и четырехканальный TR. И вполне могут быть приложения, которые плохо масштабируются в конфигурации NUMA 2990WX по причинам, не связанным с какими-либо недостатками в планировщике Windows 10.
Полный объем ошибки и ее возможные исправления еще не были полностью раскрыты, если «исправление неизвестной проблемы с Windows perf» не было подсказкой выше. Microsoft и AMD еще не выпустили официальные ответы, и неясно, в какие сроки решается эта проблема с помощью обновления ОС. Но если вы владелец 2990WX или хотите стать им, это может изменить расчет того, стоит ли инвестировать в этот чип, если вы, во-первых, очевидно, что вы очень специфический клиент. Средним и даже не таким средним геймерам нет необходимости, поскольку чипы, такие как 2990WX, вначале играют в очень ограниченном пространстве.
Читать далее
Новая серия AMD Radeon RX 6000 оптимизирована для борьбы с амперами
AMD представила серию RX 6000 сегодня. Впервые с момента покупки ATI в 2006 году использование графических процессоров AMD на платформах AMD даст определенные преимущества.
Новые детали Intel Rocket Lake: обратная совместимость, графика Xe, Cypress Cove
Intel опубликовала немного больше информации о Rocket Lake и его 10-нм процессоре, который был перенесен на 14-нм.
Хаббл исследует 16 "Психеи", астероид стоимостью 10 000 квадриллионов долларов
Исследователи только что завершили ультрафиолетовое обследование 16 Psyche, сверхценного астероида, который НАСА планирует посетить в 2026 году.
Intel представляет новые мобильные графические процессоры Xe Max для создателей контента начального уровня
Intel выпустила новый потребительский мобильный графический процессор, но у него очень специфический вариант использования, по крайней мере, на данный момент.