Nvidia AI перетворює каракулі в реалістичні пейзажі

Nvidia AI перетворює каракулі в реалістичні пейзажі

Такі каракулі MS Paint, які ви зробили в 90-х роках, могли бути просто твори мистецтва, що чекали, і ви ніколи не знали цього. Все, що їм потрібно, - це деяка допомога від генеративної змагальної мережі (GAN). Nvidia показала, що AI може використовувати просте уявлення пейзажу, щоб зробити фотореалістичну перспективу, яка не існує ніде в реальному світі.

Nvidia називає свій генератор ландшафтів на основі AI "GauGAN", який представляє собою комбінацію GAN (генеративна змагальна мережа) і Гау (художник пост-імпресіоніст Пол Гоген). Програмне забезпечення просто мертве, але це дуже важливо. Вона має всього три інструменти: відро фарби, ручку і кисть. Вибравши інструмент, натисніть на тип матеріалу внизу екрана. Типи матеріалів включають такі речі, як дерево, річка, пагорб, гора, скеля і небо.

Організація матеріалів в ескізі розповідає програмному забезпеченню, що кожна частина каракулі повинна представляти, і вона генерує його реалістичну версію в реальному часі. У ньому навіть є випадкові числові елементи, щоб забезпечити дві копії одного і того ж каракулі дадуть різні результати. Nvidia розробила GauGAN для роботи на платформі Tensor, що працює на графічному процесорі RDX Titan. Ця карта має необхідну потужність для відображення результатів у реальному часі, але GauGAN повинна технічно працювати на будь-якій платформі, навіть на базовому процесорі. Хоча, для створення зображень буде потрібно кілька секунд.

Генеративні змагальні мережі є актуальною темою у дослідженні інтелектуальної власності саме зараз, оскільки вони мають потенціал зробити мережі навчання значно простішими. Замість того, щоб підготувати мережу до міток даних, поки вона не дізнається, як її обробляти, GAN складаються з двох нейронних мереж, які конкурують один з одним. Одна мережа генерує дані (в даному випадку, ландшафти), а інша вирішує, чи виглядає вона реальною чи ні. З часом мережі краще генерують потрібний результат. У цьому випадку, GAN 1 мільйон зображень з Flickr тренувати себе.

Результати вражають, але не досконалі. Nvidia називає зображення "фотореалістичною", і вони в певному сенсі. На перший погляд, ви можете подумати, що ви дивитеся на справжнє озеро або водоспад, але є вибагливі збої і жорсткі краї, які не виглядають природно. Тим не менш, це набагато краще, ніж більшість з нас може зробити в MS Paint.

Nvidia сподівається додати GauGAN до своєї AI Playground suite, але це займе трохи більше роботи, щоб отримати програмне забезпечення готове для загального користування.