AMD Radeon VII не будет предлагать высокоскоростную двойную точность
С тех пор как AMD неожиданно анонсировала Radeon VII на CES, возникли вопросы о том, какие функции или возможности GPU может вывести на рынок, чтобы конкурировать с RTX Turing. Мы уже знаем, что таких функций, как трассировка лучей, на самом деле нет на столе (вы можете абсолютно выполнить рабочие нагрузки трассировки лучей на графическом процессоре со специализированными ядрами трассировки лучей, но влияние на производительность, как правило, оказывается огромным). Слухи о том, что GPU будет упаковывать 128 ROP, - как сообщается, вызвано ошибкой на слайде в CES, - с тех пор вернулись на землю, и у нас осталась конфигурация с 64 ROP.
Одной из возможностей уникальной возможности было то, что AMD оставила бы математическую возможность двойной точности графического процессора без изменений. Radeon MI50, на котором основан Radeon VII, предлагает 6,7TFLOPS с математической обработкой чисел с двойной точностью и 13,4TFLOPS с одинарной точностью. Последний прибудет в Radeon VII - он даже наберет некоторое ускорение в 13.8TFLOPs. Но AMD не будет доводить полную производительность FP64 до своего последнего 7-нм графического процессора.
THG сообщает, что Radeon VII будет предлагать 862GFLOPS производительности или примерно 13 процентов от того, на что способен MI50. Это несколько интересное решение для AMD по нескольким причинам. С недавним акцентом на AI и ML, оба из которых имеют тенденцию отдавать предпочтение более низким типам математической точности, а не более высокому, можно ожидать, что компании будут искусственно ограничивать производительность при использовании типов данных FP16 или INT8, а не продолжать блокировать FP64. Ограничение FP64 всегда было способом для AMD и Nvidia гарантировать, что у исследователей были веские причины покупать их топовые карты, и было бы интересно узнать, начнут ли производители устранять другие способы ограничения перекрестного опыления между платформами. (Nvidia уже начала ограничивать производительность в смешанном режиме в некоторых случаях на потребительском оборудовании.)
Еще одно забавное замечание: насколько мне известно, потребительский графический процессор AMD, который по-прежнему обеспечивает наилучшую производительность FP64, при условии, что вы можете масштабировать или запускать приложение на обоих графических процессорах одновременно, является Radeon HD 7990. Этот графический процессор эпохи 2013 года обеспечивает полную производительность FP64 на обоих ядрах, обеспечивая 1,889TFLOPS производительности FP64. Конечно, это было на двух графических процессорах и использовало гораздо более старую версию GCN - но это также говорит о том, что высокопроизводительная двойная карта с апреля 2013 года все еще технически предлагает большую производительность FP64, чем 509 GFLOPS RTX Titan X, 420GFLOPS на RTX 2080 Ti, или да - 862GFLOPS на Radeon VII. Фактически, только один из двух графических процессоров на борту HD 7990 теоретически будет превосходить Radeon VII.
Конечно, мы говорим теоретически, потому что различия в поддержке GCN, OCL и пропускной способности ОЗУ вполне могут создать сценарий, в котором возникла проблема со старой картой, несмотря на бумажные преимущества. Но ни AMD, ни Nvidia не проявили особого интереса к созданию монстра FP64 в потребительском пространстве после HD 7990. Это была одна из областей, где AMD могла бы попытаться сделать отличительную игру со своим последним высокопроизводительным графическим процессором - мы должны увидеть что компания имеет в виду немного ближе к дню запуска.
Читать далее
Starlink Maritime приносит высокоскоростный интернет на яхтам всего за 5000 долларов в месяц
Сервис является идеальным дополнением для кого-то, кто потратил несколько сотен миллионов на лодку-настройка стоит 10 000 долларов, а ежемесячная плата-в 5000 долларов.
Epson Fastfoto FF-680W Обзор: потрясающий высокоскоростный фотоканер
Если вы смотрели на обувные ящики старых фотографий, страшные, сколько времени вам понадобится, чтобы сканировать их, Epson FF-680W является отличным решением.
Samsung анонсирует высокоскоростной прорыв HBM2, Codenamed Aquabolt
Samsung нашла способ резко увеличить скорость на HBM2 без увеличения напряжения. Может ли это стать поворотным моментом для стандарта?
Phantom v2640 Высокоскоростная камера может снимать 11 750 кадров в секунду в Full HD
Эта камера записывается с разрешением более высокого разрешения, но это не впечатляющая часть. Нет, впечатляющая часть заключается в том, что он записывается с разрешением более высокого разрешения с невероятным количеством кадров 6 600 кадров в секунду. Вы можете подтолкнуть его еще выше при более низких разрешениях.