Nvidia's Jetson Agx Orin упаковывает удар AI в небольшом упаковке
Если есть какая-либо компания, которая находится на рулоне, когда речь идет о предоставлении более вычислительной мощности в меньших пакетах, это NVIDIA. Их линейка продуктов Jetson, которая обеспечивает AI и другие формы ускоренных вычислений, является отличным примером. Я смог провести некоторое время со своим последним встроенным «роботом мозга», предлагая NVIDIA JETSON AGX ORIN (начинается с 399 долларов, когда доступен для производственных приложений позже в этом году). Это имеет достаточную мощность GPU для некоторых из самых требовательных приложений робота, в то же время до сих пор приходит в тот же форм-фактор, что и Ксавье, его предшественник. Он потребляет от 15 до 60 Вт, в зависимости от используемого профиля мощности.
То, что мы рассматриваем здесь, это комплект разработчиков ($ 1 999), который в комплекте с корпусом и некоторыми аксессуарами. Теперь он доступен (теоретически, но обратные заказы были накапливаться), чтобы разработчики могли получить начало головы, но объемные количества версии, подходящей для коммерческого развертывания, не ожидаются до ближайшего окончания года.
NVIDIA JETSON ORIN по номерам
Система Orin On-Chip (SOC) основан на архитектуре GPU NVIDIA Ampere GPU и имеет 2 048 CUDA CORES, 64 TENSOR CORES и 2 двигателями глубокого обучения (DLA). Он может доставить удивительные 275 лучших верхушек производительности RAW AI для моделей, которые были оптимизированы для 8-битной целочисленной математики.
Для текущих клиентов Jetson Orin располагает одинаковым вычетом и следом, как Jetson Agx Xavier.
Это не твой отец (или материнская) jetson Dev kit
Впервые я рассмотрел набор Jetson Dev, он прибыл как доска, дочерняя дочерняя и некоторые винты. Я думаю, что мне пришлось купить свой собственный маленький вентилятор, подходящий источник питания, а я 3D напечатал сырный корпус. Комплект Orin Dev - это ода для дизайна. Обработанный металлический корпус, с внутренними вентиляторами и магнитно прикрепленной крышкой для слота PCI-E. Он выглядит круто и может нарисовать мощность либо из разъема ствола, либо порта USB-C.
Есть несколько версий комплектов разработчиков, доступных на заказ. Блок обзора у нас есть включает в себя Wi-Fi и порт Ethernet, так и 1 ГБ / с, а также четыре части USB 3.2 и два порта USB-C. Существует вывод DisplayPort 1.4A для видео также.
Рецензенты SEV Cits были предоставлены функцией 32 ГБ 256-битной RPDDR5 RAM и встроенный загрузочный диск 64 ГБ. Коммерческие подразделения будут доступны с несколькими различными вариантами. В дополнение к интервалу MicroSD также есть слот M.2, что позволяет для высокоскоростного дополнительного хранения.
Nvidia JetPack 5.0 SDK
Для начала JetPack 5.0 обновляет Ubuntu до 20,04LTS и ядро до 5.10, оба приветственные изменения. CUDA 11 и Tensort 8 также были обновлены до последних версий. UEFI теперь используется для загрузчика, а обновления перегрузки (OTA) будут возможны для развертываемых устройств Jetson.
Одной из функций, которые мне очень нравятся в отношении JETPACK 5.0, является легкой интеграцией в Deepstream Imaging Imaging и Vision Toolbox. Как только у вас есть модель, например, вы можете просто указать на нее Deepstream, придайте ему источник данных и позвольте его запустить. Процесс проще, чем когда мне нужно было соединить модель для камер, использующих предыдущие версии jetpack.
У модернизированного Тао NVIDIA и почему это имеет значение - много
Поскольку нейронные сети стали более сложными, и были обучены набором более крупных и крупных наборов для достижения беспрецедентной точности, они требуют беспрецедентных количеств вычислительной мощности и тренировочного времени. Это делает конкурентоспособные, тренируемые сетки с царапинами, которые высокоцеированы активы, созданные в основном крупными корпорациями с достаточным количеством времени и денег - и занимают тренировки из рук больше всего. К счастью, оказывается, что сети обучаются довольно общему набору данных (например, лица, изображения, кода GitHub или reddit Text), имеют в результате своего рода общего знания, которые могут быть восстановлены.
В частности, особенности, которые они научились извлечь и оценку, могут быть очень полезны в других областях. Например, функции, извлеченные из цветных изображений, также могут быть ценными при оценке IR-изображений. Лично я использовал сетевую настройку, чтобы помочь Джоэлу (управляющий редактор Wfoojjaec) с UPSaler на основе AI для DS9 (это был увлекательный эксперимент - ED), а также создать генератор статьи ET, основанный на GPT-2. Совсем недавно я использовал подготовленный NVIDIA-детектор для лица на Jetson, который я адаптировал, используя несколько наборов данных из маски из серии, чтобы научить его идентифицировать людей с масками и без них.
Реализуя решающее значение такого подхода к подготовке и выладу роботам и другим решениям «краевых», NVIDIA по-настоящему забрала свою игру здесь. Мои первые попытки использования их перекрестной (TRT) пакета были довольно болезненными и ограничены. Теперь, Tao (поезд, адаптация, оптимизация) был упакован в простой в использовании системы. Он по-прежнему требует либо записи некоторых кодов, либо адаптацию одного из примеров NVIDIA, но фактическая логика не должна быть слишком сложной. Точно так же, главное, «адаптация» и «оптимизация» кусочки теперь намного более автоматизированы.
В рамках обзора Kit для Orin NVIDIA отправила нам пример приложения, в котором мы могли бы развернуть предварительно обученную версию Peoplenet или адаптировать наши собственные с дополнительными данными. Как и ожидалось, предварительно обученная сеть достигла отличной производительности при обнаружении людей, их лицах и сумках. То, что было впечатляющим, была способность выкинуть дополнительный набор данных людей с шлемами и без него и без того, что он настроится, чтобы научиться различать их.
У меня не было времени, чтобы сделать это для этого обзора, но я планирую сделать более крупный проект, используя Tao, чтобы перестроить существующую сеть на какой-то типе новой автомобильной конструкции камеры. Это важный случай использования, поскольку разработчики новых систем камеры по определению имеют ограниченные наборы данных, фактически захваченные с их камерами. Это трудно тренировать модель с нуля только с собственными данными. Адаптация предварительно обученных моделей стала необходимостью.
NGC и Docker Images являются ключом к развитию Jetson
В последний раз я рассмотрел встроенный процессор NVIDIA, это было все о Docker Images. Это казалось очень мощным инновацией для встроенного устройства. С Orin, в то время как в смеси все еще есть несколько изображений докера, большинство SDK и моделей имеют более прямое средство для загрузки и выполнения их.
К счастью, собственный NGC NVIDIA имеет все большее количество моделей, которые могут бесплатно использовать на NVIDIA GPU и легко загружать. Тао уже «знает», как с ними работать, после того, как вы кормите его своими данными в формате, что базовый ML двигатель понимает.
Демо демонстрации PEOPLENET использует Tensorflow, работающий на Azure для обучения, хотя, конечно, он также может быть запущен на местном уровне, если у вас достаточно HPU мощности GPU. Адаптированные массы модели затем загружаются в Jetson GPU и запустите локально. Примеры высокого уровня я проработал, написаны в Python и хранятся в ноутбуках Jupyter, но набор DEV JetPack также поставляется с множеством примеров в C ++ о том, как использовать различные отдельные библиотеки NVIDIA.
Общие впечатления
Если вы не Tesla, ни компании с аналогичными ресурсами для разработки собственного стека AI трудно спорить с выбором NVIDIA Jetson Platform для робота и аналогичных приложений. Его аппаратные предложения быстро прогрессировали, сохраняя при сохранении хорошей совместимости программного обеспечения. И ни одна компания не имеет большей экосистемы разработчиков, чем NVIDIA. ГПУ, безусловно, является звездой Jetson Show, поэтому, если ваше приложение сильно зависит от CPU, это может быть проблемой.
Читать далее
AMD сокращает долю рынка, которой не удерживалась за десятилетие
AMD утверждает, что в этом квартале увеличила долю рынка настольных ПК, ноутбуков и серверов.
PlayStation 5 будет доступна в сети только в день запуска
PlayStation 5 не будет доступна в магазинах в день запуска, и если вы захотите приобрести твердотельный накопитель M.2, чтобы расширить его хранилище, у вас будет время подумать об этой покупке.
Nvidia будет имитировать память AMD Smart Access на Ampere: отчет
Память AMD Smart Access еще даже не отправлена, но Nvidia утверждает, что может дублировать эту функцию.
Nvidia и Google будут поддерживать облачные игры на iPhone через веб-приложения
И Nvidia, и Google объявили о поддержке iOS для своих облачных игровых платформ через прогрессивные веб-приложения. Apple не может это заблокировать.