Nvidia создала Swapper для домашних животных, которые учатся на нескольких примерах

Nvidia создала Swapper для домашних животных, которые учатся на нескольких примерах

Большинству ИИ, которые манипулируют или трансформируют изображения, требуется большой объем обучающих данных, чтобы служить основой для его способностей. NVIDIA нашла способ обучить модель только одним входным изображением любого домашнего животного и несколькими примерами другого животного.

В недавней статье Nvidia объясняет возможности и цель создания этого нового подхода:

Несмотря на удивительный успех, современные методы требуют доступа ко многим изображениям в исходных и целевых классах во время обучения. Мы утверждаем, что это сильно ограничивает их использование. Черпая вдохновение из человеческой способности улавливать сущность нового объекта из небольшого числа примеров и обобщать оттуда, мы ищем неконтролируемый алгоритм преобразования изображения в изображение, который работает с ранее невидимыми целевыми классами, которые указано во время тестирования только несколькими примерами изображений. Наша модель достигает этой возможности генерации нескольких выстрелов, сочетая состязательную схему обучения с новым дизайном сети.

Nvidia называет учебную структуру своей сети «переводом малоизвестных изображений без присмотра» (FUNIT), потому что она учится только на нескольких примерах класса изображений (например, бигли, белые медведи) без непосредственного руководства человека. Значительно уменьшенный необходимый размер для обучающих наборов данных даст этому методу огромное преимущество перед текущими, поскольку он улучшается в будущем. На данный момент, это требует беспрепятственного домашнего животного, чтобы дать желаемые результаты. Хотя он технически работает с человеческими лицами, результаты часто попадают в категорию «жутких».

Nvidia создала Swapper для домашних животных, которые учатся на нескольких примерах

Хотя метод Nvidia в настоящее время служит только очень конкретной цели, а его ограничения приводят к заметным недостаткам, их работа показывает обещание гораздо более впечатляющих результатов через несколько итераций. Благодаря общедоступному коду, доступному каждому, на которого можно опираться (и общедоступной демонстрации для всех остальных), у качества FUNIT больше шансов достичь полезных результатов гораздо раньше.

Если смотреть в более широкую картину, FUNIT прекрасно вписывается в категорию проблем, с которыми Nvidia столкнулась с искусственным интеллектом. Наряду с превращением объективно ужасных набросков в законченные ландшафты и созданием полной трехмерной городской среды для разработки игр, кажется, что Nvidia надеется создать набор инструментов, который значительно сократит время и затраты, необходимые для создания видеоигр. Когда активы персонажей для титулов AAA могут стоить около 80 000 долларов, игровые студии могут значительно сократить расходы с помощью искусственного интеллекта.

Конечно, FUNIT понадобится более чем разумная способность для подмены собак, прежде чем он сможет помочь создать инструментарий ИИ, способный генерировать подробные и динамичные игровые ресурсы наравне с человеческим талантом.

Изображение предоставлено: Adam Dachis (перевод результатов Nvidia)

Читать далее

Samsung, Стэнфорд, создали дисплей с разрешением 10000 пикселей на дюйм, который может революционизировать VR и
Samsung, Стэнфорд, создали дисплей с разрешением 10000 пикселей на дюйм, который может революционизировать VR и

Спросите любого, кто провел в гарнитуре VR более нескольких минут, и они отметят эффект дверного экрана. Это могло бы устранить его навсегда.

НАСА создало коллекцию жутких космических звуков для Хэллоуина
НАСА создало коллекцию жутких космических звуков для Хэллоуина

Последний выпуск данных НАСА превращает сигналы из-за пределов Земли в жуткие звуки, которые наверняка вызовут мурашки по позвоночнику.

Intel представляет новые мобильные графические процессоры Xe Max для создателей контента начального уровня
Intel представляет новые мобильные графические процессоры Xe Max для создателей контента начального уровня

Intel выпустила новый потребительский мобильный графический процессор, но у него очень специфический вариант использования, по крайней мере, на данный момент.

MIT создает подводный GPS-навигатор без батарей
MIT создает подводный GPS-навигатор без батарей

Радиосигналы GPS быстро рассеиваются при попадании в воду, что затрудняет научные исследования в море. Единственная альтернатива - использовать акустические системы, которые разжевывают батарейки. Команда из Массачусетского технологического института разработала технологию слежения без батарей, которая могла бы положить конец этому раздражению.