Nvidia створила Face Swapper для домашніх тварин, що вивчає лише кілька прикладів

Nvidia створила Face Swapper для домашніх тварин, що вивчає лише кілька прикладів

Більшість ІІ, що маніпулює або трансформує зображення, вимагає великої кількості навчальних даних, які служать основою для його здібностей. NVIDIA знайшла спосіб навчити модель тільки одним вхідним зображенням будь-якого вихованця і декількома прикладами іншої тварини.

У недавньому документі Nvidia пояснює можливості та мету створення цього нового підходу:

Незважаючи на успіх, сучасні методи вимагають доступу до багатьох зображень як у вихідному, так і в цільовому класах під час навчання. Ми стверджуємо, що це значно обмежує їх використання. Натхненний людською здатністю підбирати суть нового об'єкта з невеликої кількості прикладів і узагальнюючи звідти, ми шукаємо алгоритм перекладу із зображенням на зображення, який працює на раніше невидимих ​​цільових класах, які є вказано, в тестовий час, лише декількома прикладами зображень. Наша модель досягає цієї здатності генерувати кілька пострілів, поєднуючи схему змагальної підготовки з новим дизайном мережі.

Nvidia називає навчальну структуру своєї мережі «Невеликим неперевіреним перекладом зображень» (FUNIT), оскільки вона дізнається лише з декількох прикладів класу зображення (наприклад, біглів, полярних ведмедів) без безпосереднього людського керівництва. Значно зменшений необхідний розмір для навчальних наборів даних дасть цьому методу величезну перевагу над існуючими, оскільки він покращується в майбутньому. На даний момент це вимагає вільного обличчя тварини, щоб отримати бажані результати. Незважаючи на те, що він технічно функціонує з людськими обличчями, результати часто зручно потрапляють до «страшної» категорії.

Nvidia створила Face Swapper для домашніх тварин, що вивчає лише кілька прикладів

Незважаючи на те, що в даний час метод Nvidia має лише специфічну мету, і його обмеження призводять до помітних недоліків, їхня робота показує обіцянку набагато більш вражаючих результатів за декілька ітерацій. З відкритим кодом, доступним для будь-кого, на кого можна побудувати (і публічне демонстрацію для всіх інших), якість FUNIT має більше шансів досягти корисних результатів набагато раніше.

Дивлячись на велику картину, FUNIT добре вписується в категорію проблем, до яких Nvidia звертався зі штучним інтелектом. Поряд з поворотом об'єктивно страшних ескізів у повні ландшафти та створення повноцінних 3D-міських середовищ для розробки ігор, Nvidia сподівається створити набір інструментів, що значно скоротить час і витрати, необхідні для створення активів відеоігор. Коли атрибути характеру для назв AAA можуть коштувати близько $ 80,000, ігрові студії можуть скоротити витрати на значну суму за допомогою штучного інтелекту.

Звичайно, FUNIT потребуватиме більше, ніж розумну здатність до обміну собак, перш ніж вона допоможе скласти набір інструментів AI, здатних генерувати детальні та динамічні ігрові активи нарівні з людським талантом.

Зображення: Адам Дачіс (переклад за Nvidia)