Нвидия А.И. превращает каракули в реалистичные пейзажи

Нвидия А.И. превращает каракули в реалистичные пейзажи

Те рисунки MS Paint, которые вы сделали в 90-х годах, могли быть произведениями искусства, которые просто ожидали, и вы никогда не знали об этом. Все, что им было нужно, - это какая-то помощь со стороны генерирующей состязательной сети (GAN). Nvidia показала, что ИИ может использовать простое представление ландшафта для визуализации фотореалистичного изображения, которого нет нигде в реальном мире.

Nvidia называет свой ландшафтный генератор с искусственным интеллектом «GauGAN», который представляет собой гибрид GAN (генеративной сети противоборства) и Gau (постимпрессионистский художник Поль Гоген). Программное обеспечение очень простое, но это очень важно. В нем всего три инструмента: ведро с краской, ручка и кисть. После выбора инструмента вы нажимаете на тип материала в нижней части экрана. Типы материалов включают в себя такие вещи, как дерево, река, холм, гора, камень и небо.

Организация материалов в эскизе сообщает программному обеспечению, что должна представлять каждая часть каракули, и генерирует реалистичную версию в реальном времени. Он даже имеет случайные числовые элементы, чтобы гарантировать, что две копии одного и того же рисунка дадут разные результаты. Nvidia разработала GauGAN для работы на вычислительной платформе Tensor на базе графического процессора RDX Titan. Эта карта обладает необходимой мощностью для рендеринга вывода в реальном времени, но GauGAN должен технически работать на любой платформе, даже на базовом процессоре. Хотя на создание изображений уйдет несколько секунд.

Генерирующие противоборствующие сети сейчас являются горячей темой в исследованиях ИИ, потому что они могут значительно упростить обучение. Вместо того, чтобы подавать данные, помеченные сетью, пока они не научатся обрабатывать их, GAN состоят из двух нейронных сетей, которые конкурируют друг с другом. Одна сеть генерирует данные (в данном случае ландшафты), а другая решает, выглядит ли она реальной или нет. Со временем сети становятся лучше в генерировании желаемого результата. В этом случае передал GAN 1 миллион изображений из Flickr для обучения.

Результаты впечатляющие, но не идеальные. Nvidia называет изображения «фотореалистичными», и они в некотором роде. На первый взгляд вам может показаться, что вы смотрите на настоящее озеро или водопад, но есть явные сбои и жесткие края, которые не выглядят естественными. Тем не менее, это намного лучше, чем большинство из нас могут сделать в MS Paint.

Nvidia надеется добавить GauGAN в свой пакет AI Playground, но потребуется немного больше работы, чтобы подготовить программное обеспечение для публичного использования.

Читать далее

Маск завершает поглощение в Твиттере, обещает, что он не станет «адским пейзажем»
Маск завершает поглощение в Твиттере, обещает, что он не станет «адским пейзажем»

Маск намекнул на некоторые серьезные изменения в том, как работает Twitter, в том числе окончание запретов на всю жизнь, но он обещает, что это не станет «свободным для общего адского пейзажа». Хотя может быть невозможно прорезать эту иглу.