AMD Radeon VII не будет предлагать высокоскоростную двойную точность
С тех пор как AMD неожиданно анонсировала Radeon VII на CES, возникли вопросы о том, какие функции или возможности GPU может вывести на рынок, чтобы конкурировать с RTX Turing. Мы уже знаем, что таких функций, как трассировка лучей, на самом деле нет на столе (вы можете абсолютно выполнить рабочие нагрузки трассировки лучей на графическом процессоре со специализированными ядрами трассировки лучей, но влияние на производительность, как правило, оказывается огромным). Слухи о том, что GPU будет упаковывать 128 ROP, - как сообщается, вызвано ошибкой на слайде в CES, - с тех пор вернулись на землю, и у нас осталась конфигурация с 64 ROP.
Одной из возможностей уникальной возможности было то, что AMD оставила бы математическую возможность двойной точности графического процессора без изменений. Radeon MI50, на котором основан Radeon VII, предлагает 6,7TFLOPS с математической обработкой чисел с двойной точностью и 13,4TFLOPS с одинарной точностью. Последний прибудет в Radeon VII - он даже наберет некоторое ускорение в 13.8TFLOPs. Но AMD не будет доводить полную производительность FP64 до своего последнего 7-нм графического процессора.
THG сообщает, что Radeon VII будет предлагать 862GFLOPS производительности или примерно 13 процентов от того, на что способен MI50. Это несколько интересное решение для AMD по нескольким причинам. С недавним акцентом на AI и ML, оба из которых имеют тенденцию отдавать предпочтение более низким типам математической точности, а не более высокому, можно ожидать, что компании будут искусственно ограничивать производительность при использовании типов данных FP16 или INT8, а не продолжать блокировать FP64. Ограничение FP64 всегда было способом для AMD и Nvidia гарантировать, что у исследователей были веские причины покупать их топовые карты, и было бы интересно узнать, начнут ли производители устранять другие способы ограничения перекрестного опыления между платформами. (Nvidia уже начала ограничивать производительность в смешанном режиме в некоторых случаях на потребительском оборудовании.)
Еще одно забавное замечание: насколько мне известно, потребительский графический процессор AMD, который по-прежнему обеспечивает наилучшую производительность FP64, при условии, что вы можете масштабировать или запускать приложение на обоих графических процессорах одновременно, является Radeon HD 7990. Этот графический процессор эпохи 2013 года обеспечивает полную производительность FP64 на обоих ядрах, обеспечивая 1,889TFLOPS производительности FP64. Конечно, это было на двух графических процессорах и использовало гораздо более старую версию GCN - но это также говорит о том, что высокопроизводительная двойная карта с апреля 2013 года все еще технически предлагает большую производительность FP64, чем 509 GFLOPS RTX Titan X, 420GFLOPS на RTX 2080 Ti, или да - 862GFLOPS на Radeon VII. Фактически, только один из двух графических процессоров на борту HD 7990 теоретически будет превосходить Radeon VII.
Конечно, мы говорим теоретически, потому что различия в поддержке GCN, OCL и пропускной способности ОЗУ вполне могут создать сценарий, в котором возникла проблема со старой картой, несмотря на бумажные преимущества. Но ни AMD, ни Nvidia не проявили особого интереса к созданию монстра FP64 в потребительском пространстве после HD 7990. Это была одна из областей, где AMD могла бы попытаться сделать отличительную игру со своим последним высокопроизводительным графическим процессором - мы должны увидеть что компания имеет в виду немного ближе к дню запуска.
Читать далее
ИИ Intel может обнаружить DeepFakes с точностью 96 процентов
Fakecatcher ищет то, что действительно оживляет нас: кровь.
Новый SWOT -спутник НАСА проведет глобальный уровень воды с беспрецедентной точностью.
Эта миссия будет использовать огромные радиолокационные антенны, чтобы сделать наиболее точные измерения в истории уровня воды на поверхности Земли.
Post-Quantum Firefox 58 пакетов Дополнительная многопоточность
Firefox Quantum запущен несколько месяцев назад и впечатлил нас своей производительностью и возможностями. Теперь FF 58 здесь, чтобы сгладить несколько грубых краев и добавить некоторые улучшения производительности.
Вопросы кардиолога Точность функции ЭКГ в Apple Watch 4
Новый Watch 4 от Apple включает в себя возможности мониторинга ЭКГ и AFib, но их точность не была доказана так всесторонне, как хотелось бы.