Студенты создают DIY суперкомпьютер из Nvidia Jetson Nanos
В течение почти столько же, сколько у нас были суперкомпьютеры, у нас также были люди, которые спрашивали себя: «Как мне создать себе один из них, кроме как с десятой бюджетом и использованием лишь часть власти?» Несколько команд ученых создали «кластеры Беовульфа», суперкомпьютеры, которые на самом деле являются кластерами оборудования для товаров, делясь своей собственной локальной сети. И помните все эти суперкомпьютеры PlayStation? Теперь команда студентов Южного методистского университета в Далласе построила суперкомпьютер, соединив 16 модулей Nvidia Jetson Nano вместе, а также четыре расходных материала, сетевой выключатель, несколько вентиляторов охлаждения и примерно пять дюжин проводов ручной работы. (Факт: у всех лучших прототипов всегда есть выброшенные вручную провода, висящие за спиной.)
По словам Коннера Озенна, старшего специалиста по информатике и одним из главных в проекте, «мы решили использовать модули NVIDIA Jetson, потому что никакие другие небольшие вычислительные устройства не имеют на бортных графических процессорах, которые позволят нам решать больше проблем с ИИ и машинного обучения».
Суперкомпьютер «детка»
Архитектурно, Jetson Nano наиболее похож на Nintendo Switch, который работает на Nvidia Tegra X1 SOC, поэтому мы будем использовать это в качестве точки сравнения.
Переключатель и Nano имеют такую же теоретическую максимальную пропускную способность памяти (25,6 ГБ/с). У них также есть тот же четырехъядерный Cortex-A57 SOC, но процессор Nano значительно выше (1,43 ГГц против 1,02 ГГц для переключателя при состывшем). Однако, что касается относительной мощности GPU двух платформы, ситуация перевернута. Tegra X1 SOC, базирующаяся в Максвелле, внутри переключателя предлагает 256 шейдеров по сравнению с 128 на Jetson Nano.
Хотя это означает, что нано будет вдвое меньше скорости переключателя в той же рабочей нагрузке, разрыв может быть не таким большим. По сообщениям, переключатель достигает 768 МГц в режиме пристыков, в то время как Jetson Nano имеет максимальные часы до 921 МГц. В целом, суперкомпьютер «Baby» сочетает в себе 64 ядра Cortex-A57, 64 ГБ оперативной памяти и 1048 сердечников Maxwell на 16 досках.
Нано оправдывает свое имя
Давайте сначала займем слона в комнате. Объективные характеристики суперкомпьютера SMU 16 бортов едва ли вдохновляют, учитывая, что одноразовые настольные системы теперь предлагают до 64 ядер. Jetson Nano действительно оправдывает «нано» часть своего имени здесь. Мало того, что статистика довольно симпатичная пешеход, весь кластер буквально подходит на стол.
Но все шутят в стороне, сравнивая характеристики такой системы с обычным аппаратным обеспечением ПК, упускает эту точку зрения. Проблемы, связанные с эффективной масштабированием рабочих нагрузок по большой сети медленных устройств, с относительно небольшим количеством памяти на устройство, концептуально схожи, обсуждает ли человек истинные суперкомпьютеры или встроенные системы встроенных устройств, такие как этот.
«Мы начали этот проект, чтобы продемонстрировать орехи и болты того, что входит в компьютерный кластер», - сказал Эрик Годат, руководитель группы по исследованиям и науке о данных в ИТ -организации SMU. «Mini-Cluster является эффективным учебным инструментом для того, как все эти вещи действительно работают-он позволяет студентам экспериментировать с очисткой проводов, управлением параллельной файловой системой, повторным карт и развертывающим программное обеспечение кластера».
Цена против производительности
Любая данная рабочая нагрузка AI, вероятно, будет лучше работать на GTX 980 (2048 ядер на одном чипе), в отличие от 16 графических процессоров Jetson Nano на 16 досках, но последнее гораздо лучше, хотя и все еще упрощенное, моделирование некоторых из сложных задач полным -Калевые инженеры по суперкомпьютере имеют дело с работой.
Сообщение в блоге Nvidia ссылается на идею обновления текущей системы из 16 бортов с помощью оборудования Jetson Orin Nano. Ускорение производительности от любого такого прыжка будет значительным. Как мы ранее подробно описали, Orin Nano предлагает шесть сердечников процессоров Cortex A-78AE при 1,5 ГГц и 512 ядра Ampere GPU с 16 тензорными ядрами. Jetson Nano-это сравнительная креветка с 4-х процессорами Cortex-A57 и 128 Maxwell Cores. Однако Орин Нано дороже, чем Jetson Nano, по сравнению с 199 долларов против 129 долларов.
Повышение производительности Orin Nano должно быть намного больше, чем увеличение цены, но мы надеемся, что Nvidia принесет все еще более дешевую Orin на рынок в этом пространстве. Orin Nano за 129 долларов с 256 ядрами Ampere и, скажем, восемь тензорных ядер все равно будет огромным обновлением.
В то же время у Nvidia мало оснований снизить цены. Прямо сейчас, Jetson Nano действительно конкурирует с самим собой. Несмотря на то, что есть другие доски на основе руки, которые совместимы с акселераторами, графический процессор Jetson Nano является единственным продуктом в своем классе цен и своего типа.
Студенты будут демонстрировать свой мини -кластер на суперкомпьютерной конференции SC22 в Далласе. В этом году SC22 работает 13-18 ноября.
Читать далее
Как создать детектор маски для лица с помощью Jetson Nano 2GB и AlwaysAI
Nvidia продолжает делать ИИ на периферии более доступным и простым в развертывании. Поэтому вместо того, чтобы просто бегать по тестам для обзора нового Jetson Nano 2GB, я решил заняться самостоятельным проектом по созданию собственного детектора маски для лица.
Nvidia's Jetson Agx Orin упаковывает удар AI в небольшом упаковке
Хотя физика в некоторой степени предсказала «Законом Мура», замедлило скорость прогресса в некоторых аспектах вычислений, GPUS продолжает улучшаться при впечатляющем уровне. Новый jetson agx agx arin nvidia - это тот же размер, что и старший ксавье, но упаковывает 2-8x лошадиные силы AI, в зависимости от приложения. Мы взяли руки на одну и положили его через свои шаговые.
Nvidia объявляет Jetson Orin Nano, обновления Isaac Nova Orin Dev Kit
Это все о крае, детка.
Nvidia's Jetson Xavier Stuffs Volta Performance в крошечном форм-факторе
Плата Nvidia Jetson Xavier - важный шаг вперед для усилий компании по созданию надежных ускорителей AI на всех уровнях TDP.