Титан V Nvidia обвиняется в возвращении неверных ответов в симуляциях

Титан V Nvidia обвиняется в возвращении неверных ответов в симуляциях

Nvidia долгое время занимала поул-позицию в вычислениях GPGPU, особенно в научных и высокопроизводительных приложениях. Долгосрочные инвестиции компании в CUDA и высокопроизводительные вычисления завоевали ряд пятен в суперкомпьютере TOP500 и способствовали росту линейки продуктов Tesla, включая графические процессоры, такие как Titan V $ 3000, видеокарта на основе Volta, которая охватывает между потребителем и научным продуктом. Но все может быть не так хорошо с Titan V - есть сообщения, что чип может производить разные результаты от запуска до запуска.

Это слово из Регистра, в котором написано:

Один из инженеров сказал The Register, что, когда он пытался запустить идентичные симуляции взаимодействия между белком и ферментом на картах Titan V от Nvidia, результаты варьировались. После повторных тестов на четырех из лучших графических процессоров он обнаружил, что две цифры дали числовые ошибки примерно в 10% случаев. Эти тесты должны давать одинаковые выходные значения каждый раз снова и снова. На предыдущих поколениях аппаратного обеспечения Nvidia это было в общем случае. На Титане V, не так, нам сказали.

В Reg также отмечается, что он также говорил с «ветераном отрасли», который предположил, что проблема может быть связана с проблемами с памятью HBM. Тот же самый человек отметил, что это может быть связано с проблемами с бортовой ОЗУ GPU и что Nvidia столкнулась с такой проблемой раньше и была вынуждена выпустить исправления для ее устранения.

Титан V Nvidia обвиняется в возвращении неверных ответов в симуляциях

В других местах другие сообщества отметили, что проблема может быть раздута. Параллельные вычисления с плавающей точкой не обязательно детерминированы, т. Е. Не дают автоматически одинаковые результаты каждый раз. Если порядок операций отличается от выполняемого для запуска, конечный результат также может быть другим.

Однако маловероятно, чтобы ученые и исследователи допустили известную проблему (недетерминированный выход в параллельных вычислениях FP) для существенной аппаратной проблемы. Источник Reg сообщил, что Titan V может давать неверные результаты примерно в 10% случаев, но не содержит подробностей о том, какие приложения были затронуты, зависит ли частота проблемы от приложения к приложению или может быть затронута изменением различных Настройки графического процессора.

Сейчас у нас больше вопросов, чем ответов. Проблема, если она существует, может быть адресована с помощью драйвера или изменения кода. Это может также отражать проблему с подсистемой памяти GPU, как это предполагает The Reg. Некоторые приложения HPC обновили свои собственные веб-сайты, чтобы указать, что они знают о потенциальной проблеме и еще не видели ее. Также возможно, что проблема ограничена несколькими картами и не указывает на общую проблему.

Что касается Nvidia, компания сообщила, что Reg знает об этой проблеме и пригласила всех, кто пострадал, связаться с самой Nvidia. Titan V на самом деле не позиционируется как игровой графический процессор, но на данный момент игры не влияют или не влияют.

Читать далее

Линус Торвальдс обвиняет Intel в уничтожении оперативной памяти ECC в потребительских системах
Линус Торвальдс обвиняет Intel в уничтожении оперативной памяти ECC в потребительских системах

Intel лишила свои потребительские продукты поддержки ECC RAM более десяти лет назад, и Линус Торвальдс до сих пор недоволен этим.

FCC обвиняет запуск запуска Tiny Rogue Satellites
FCC обвиняет запуск запуска Tiny Rogue Satellites

Если это будет подтверждено, это станет первым несанкционированным запуском коммерческих спутников.

Tesla обвиняет водителя в краже автопилота модели X
Tesla обвиняет водителя в краже автопилота модели X

Тесла обвиняет водителя в недавнем фатальном крахе, но более крупные проблемы остаются без внимания, и семья жертвы наняла юридическую фирму для проведения собственного анализа.

Qualcomm обвиняет Apple в предоставлении торговых секретов Intel
Qualcomm обвиняет Apple в предоставлении торговых секретов Intel

Qualcomm обвинила Apple в краже коммерческой тайны, связанной с ее современной технологией, и предоставила технологии Intel.