Google добавляет Nvidia Volta к своим облачным платформам

Google добавляет Nvidia Volta к своим облачным платформам

С недавними новостями о том, что облачный TPU Google более экономичен, чем Volta от Nvidia, вы можете подумать, что Google будет готовиться к замене графических процессоров конкурентов своим собственным оборудованием. Вместо этого компания расширяет свои предложения GPU для Volta Nvidia и развертывает GPU в более широком диапазоне двигателей. Более того, это говорит о широком спектре поддержки различных типов машинного обучения, рабочих нагрузок AI и общей вычислительной производительности, доступной теперь через облачные сервисы.

Согласно последнему сообщению в блоге Google, графические процессоры Nvidia V100 Tesla теперь доступны как для вычислительного двигателя, так и для Kubernetes Engines. Kupernetes обычно используется для масштабирования приложений в контейнерах в облаке, в то время как Compute Engine Google - это облако серверов, которое используется для запуска рабочих нагрузок, которые могут быть выгружены для обработки и вычисления. И теперь, любезно предоставленное этим последним обновлением, вы можете складывать восемь графических процессоров Tesla V100, 96vCPU (термин Google для виртуализованного ядра процессора) и 624 ГБ памяти в одной виртуальной машине, которая, как правило, немного больше мощности, чем ваш типичный отдельный сервер может собрать. NVLink следующего поколения предлагает до 300 ГБ / с пропускной способности GPU-GPU, и преимущества, по-видимому, хорошо масштабируются - Google утверждает, что это повышает производительность при глубоком обучении и нагрузках HPC на 40%.

Google пишет, что «NVIDIA V100s доступны сразу в следующих регионах: us-west1, us-central1 и europe-west4. Каждый графический процессор V100 стоит всего 2,48 долл. США в час для виртуальных машин по требованию и 1,24 долл. США в час для превентивных ВМ. Как и наши другие графические процессоры, V100 также оплачивается вторым, и применяются скидки на постоянное использование ».

Компания также дает небольшую информацию о рабочей нагрузке. Он рекомендует использовать графические процессоры N100 Nvidia на базе Pascal для рабочих нагрузок, требующих баланса между ценой и производительностью, в то время как графические процессоры K80 (Kepler) по-прежнему доступны для еще менее трудоемких рабочих нагрузок.

Google добавляет Nvidia Volta к своим облачным платформам

Эта диаграмма косвенно подчеркивает, почему облачные вычисления могут иметь финансовый смысл как для компаний, так и для пользователей. В потребительском выражении K80 является древним. Это часть с двумя GPU с 2,496 ядрами и 2x 12 ГБ GDDR5. Он полностью превзойден и превосходит графические процессоры, такие как V100, но он также доступен всего за 45 центов в час. Если бы вы сравнивали такую ​​почасовую ставку со стоимостью покупки всего сервера, когда K80 был новым, вы, очевидно, сэкономили бы огромную сумму, просто нажав на облако для рабочих нагрузок, которые вам нужно обработать.

Исходя из цены, которую мы видим для базовых серверов и самого K80, точка безубыточности между стоимостью нового K80 и использованием вычислительного двигателя Google составляет около 10 000 часов. Поэтому, если вы считаете, что вам потребуется эквивалент 416 дней времени GPU для обработки рабочей нагрузки, может быть, лучше просто купить карту. И Nvidia, конечно, не заботится о разнице между продажей карты исследовательскому учреждению, которое будет развертывать его на своих собственных серверах, и продавать его Google или Amazon или Microsoft для интеграции в рамках облачного сервера , Nvidia просто хочет продать карту.

Интересно, что на той же странице есть намек на то, что Google может скоро расширить свои предложения облаков, чтобы охватить более дешевые карты. Один читатель, Сет Прайс, пишет: «Мне не нужен графический процессор на верхней полке для моей работы; Мне нужны только дешевые FLOPS / $. Будем ли мы когда-либо видеть графические процессоры на потребительском уровне, предлагаемые на GCP, которые стоят менее 1000 долларов США каждый ... Я просто ищу быстрый, эффективный, графический процессор с низкой стоимостью. Мне не нужны они, чтобы быть лучшими коробками CUDA. Мне не нужна точность двойного с плавающей точкой на уровне научного уровня. Мне не нужны смешные количества VRAM. Мне не выгодно платить 100 раз больше за час для экземпляра GPU, чем экземпляр CPU, и я действительно не хочу создавать свои собственные коробки. Смогут ли GCP выполнить эти требования? »

На что Адриан Грэхем, архитектор облачных решений в Google, ответил: «Мы слышим вас. Следите за обновлениями.