AMD комментирует проблемы планирования Threadripper 2990WX

AMD комментирует проблемы планирования Threadripper 2990WX

С тех пор, как AMD выпустила свой Threadripper 2990WX, возникли вопросы о том, насколько эффективно он может масштабироваться в многопоточных рабочих нагрузках. Первоначально падение производительности и замедление в некоторых рабочих нагрузках были связаны с асимметричной конфигурацией контроллера памяти - только некоторые матрицы Threadripper имеют прямой доступ к контроллерам памяти, а другие подключаются только косвенно. По-видимому, это привело к значительной потере производительности в некоторых тестах.

Но информация быстро появилась, предполагая, что проблема была не в оборудовании. Под Linux 2990WX поддерживал высокий уровень производительности, даже когда он проваливался в той же конфигурации в Windows. Ясно, что в этой истории было что-то еще. Anandtech, которая сотрудничает с Wendell из Level1Tech's, опубликовала собственное обновление о ситуации.

AMD комментирует проблемы планирования Threadripper 2990WX

Похоже, что Windows предназначена для поддержки настройки «Лучший узел NUMA» и пытается запускать потоки на этих ядрах. Планировщик пытается перемещать узлы в эти позиции как можно чаще, но удаляет предыдущие потоки, которые также должны были быть назначены этому базовому кластеру.

AMD комментирует проблемы планирования Threadripper 2990WX

Однако на системы с тремя или более узлами все еще влияют, поэтому мы видим, что проблема касается и Epyc 7551, и Threadripper 2990WX. Причина, по которой работает CorePrio NUMA Disassociator, заключается в том, что он проверяет активное программное обеспечение каждые несколько секунд и регулирует соответствие потоков во время работы приложения. Думайте об этом как о ручной операции сортировки, выполняемой периодически, чтобы гарантировать, что встроенный планировщик операционной системы работает должным образом.

По словам AMD, у нее есть билеты, открытые для Microsoft, и она изучает способы решения этой проблемы как можно быстрее. Понимание Уэнделлом этой проблемы, предположительно, «очень близко» к тому, что происходит на самом деле, но подробности различий не были даны. Говорят, что Microsoft сейчас работает над исправлением, хотя сроки включения не ясны. Следующим логическим моментом включения этого обновления будет Redstone 6, он же грядущий Центр обновления Windows, который выйдет в первой половине 2019 года.

Было много предположений пользователей о том, чья это «вина». В какой-то степени вопрос плохо сформулирован. AMD может сообщить Microsoft о проблеме с расписанием в любой момент, но это не означает, что Microsoft автоматически помечает проблему для разрешения - особенно в контексте только что запущенного ЦП на самой вершине рынка с незначительной базой пользователей.

Мы знаем, что у AMD теперь есть линия связи, открытая для Microsoft, и мы можем предположить, когда решения могут появиться на рынке. Безусловно, ничто не повредит тому, что в этом году на рынке появятся процессорные процессоры Intel Cascade Lake Advanced Performance с 48 ядрами и чипсетом. С точки зрения Microsoft, возможно, было бы разумнее подождать и представить все настройки, необходимые для поддержки ряда новых конфигураций NUMA, в том числе Threadripper 2990WX, в то же время дебютируя с более сильной поддержкой 7-нм Epyc, 32-ядерных и выше CPU Threadripper, точка доступа Cascade Lake и будущие продукты Intel в том же обновлении.

Пользователи с 2990WX должны загрузить модифицированную версию CorePrio для повышения производительности - нам придется подождать и посмотреть, что представляет официальная версия поддержки планировщика, чтобы увидеть, может ли она повысить производительность помимо приложения.