Титан V Nvidia обвиняется в возвращении неверных ответов в симуляциях

Титан V Nvidia обвиняется в возвращении неверных ответов в симуляциях

Nvidia долгое время занимала поул-позицию в вычислениях GPGPU, особенно в научных и высокопроизводительных приложениях. Долгосрочные инвестиции компании в CUDA и высокопроизводительные вычисления завоевали ряд пятен в суперкомпьютере TOP500 и способствовали росту линейки продуктов Tesla, включая графические процессоры, такие как Titan V $ 3000, видеокарта на основе Volta, которая охватывает между потребителем и научным продуктом. Но все может быть не так хорошо с Titan V - есть сообщения, что чип может производить разные результаты от запуска до запуска.

Это слово из Регистра, в котором написано:

Один из инженеров сказал The Register, что, когда он пытался запустить идентичные симуляции взаимодействия между белком и ферментом на картах Titan V от Nvidia, результаты варьировались. После повторных тестов на четырех из лучших графических процессоров он обнаружил, что две цифры дали числовые ошибки примерно в 10% случаев. Эти тесты должны давать одинаковые выходные значения каждый раз снова и снова. На предыдущих поколениях аппаратного обеспечения Nvidia это было в общем случае. На Титане V, не так, нам сказали.

В Reg также отмечается, что он также говорил с «ветераном отрасли», который предположил, что проблема может быть связана с проблемами с памятью HBM. Тот же самый человек отметил, что это может быть связано с проблемами с бортовой ОЗУ GPU и что Nvidia столкнулась с такой проблемой раньше и была вынуждена выпустить исправления для ее устранения.

Титан V Nvidia обвиняется в возвращении неверных ответов в симуляциях

В других местах другие сообщества отметили, что проблема может быть раздута. Параллельные вычисления с плавающей точкой не обязательно детерминированы, т. Е. Не дают автоматически одинаковые результаты каждый раз. Если порядок операций отличается от выполняемого для запуска, конечный результат также может быть другим.

Однако маловероятно, чтобы ученые и исследователи допустили известную проблему (недетерминированный выход в параллельных вычислениях FP) для существенной аппаратной проблемы. Источник Reg сообщил, что Titan V может давать неверные результаты примерно в 10% случаев, но не содержит подробностей о том, какие приложения были затронуты, зависит ли частота проблемы от приложения к приложению или может быть затронута изменением различных Настройки графического процессора.

Сейчас у нас больше вопросов, чем ответов. Проблема, если она существует, может быть адресована с помощью драйвера или изменения кода. Это может также отражать проблему с подсистемой памяти GPU, как это предполагает The Reg. Некоторые приложения HPC обновили свои собственные веб-сайты, чтобы указать, что они знают о потенциальной проблеме и еще не видели ее. Также возможно, что проблема ограничена несколькими картами и не указывает на общую проблему.

Что касается Nvidia, компания сообщила, что Reg знает об этой проблеме и пригласила всех, кто пострадал, связаться с самой Nvidia. Titan V на самом деле не позиционируется как игровой графический процессор, но на данный момент игры не влияют или не влияют.

Читать далее

SSD-накопители Samsung 870 EVO: SATA наносит ответный удар
SSD-накопители Samsung 870 EVO: SATA наносит ответный удар

Новый 870 EVO от Samsung - один из самых быстрых SSD-накопителей, и если вам нужен диск объемом 4 ТБ, цена тоже не так уж и плоха.

Обнаружено более загадочные быстрые перерывы, с возможным ответом в поле зрения
Обнаружено более загадочные быстрые перерывы, с возможным ответом в поле зрения

Эти аномальные импульсы энергии были обнаружены в 2007 году, а появляется новый набор данных, охватывающий сотни FRBS. Это может быть продвижение, которое помогает нам понять FRB раз и для всех.

TSMC не будет утерять конфиденциальную информацию о клиентах в ответ на запросы на прозрачность США
TSMC не будет утерять конфиденциальную информацию о клиентах в ответ на запросы на прозрачность США

TSMC объявил, что не будет сотрудничать с необоснованными нами запросами на информацию о своих клиентах, но Декларация может быть больше для шоу, чем что-либо.

Боинг принимает ответственность за авария эфиопских авиакомпаний
Боинг принимает ответственность за авария эфиопских авиакомпаний

Подача также снимает пилоты на борту эфиопских авиакомпаний полет 302 ответственности за авария - но поставляется с прилагаемыми строками, поскольку любое правовое соглашение.