DeepMind будує AI, який реконструює 3D-об'єкти з однієї фотографії

DeepMind будує AI, який реконструює 3D-об'єкти з однієї фотографії

У підрозділі Google DeepMind останнім часом брали участь в деяких найпрогресивніших досягненнях компанії AI - від перемог гравців Go до розробки більш реалістичного синтезу мовлення. Тепер DeepMind намагається вдосконалити те, як машини розуміють і моделюють тривимірні простори. Дослідники DeepMind AI створили нейронну мережу, яка може передбачити, як буде виглядати простір після перегляду одного чи кількох зображень, навіть якщо видно лише частини кімнати.

В основі цього проекту лежить прагнення зробити навчання нейронних мереж легким. Зазвичай ви повинні змусити людей позначати дані, які ви використовуєте для навчання нейронної мережі. Після подання даних в, вузли в мережі обчислюють ваги і подають вперед у більше вузлів. Зрештою, вихід системи повинен відповідати тому, що ви ввели. Звичайно, це не спочатку, тому вам потрібно налаштувати мережу, поки вона не буде підготовлена. Нова генеративна мережа запитів DeepMind (GQN) може вивчати відмінні вклади та застосувати свої знання до нових ситуацій.

Команда створила 3D віртуальні простори з векторів, а потім створили їх окремі кадри для аналізу системи. GQN насправді є двома нейронними мережами - є мережа, яка вивчається зображень, а друга, яка створює нові перспективи. Команда моделювала віртуальний робочий рукоятка, блок-подібний стіл і простий лабіринт.

Після навчання GQN на мільйонах зображень, система може створювати точні уявлення про об'єкт чи кімнату лише одним нерухомим зображенням. Це схоже на те, як працює ваш мозок. Якщо ви бачите стіну посередині кімнати, ви, напевно, уявляєте собі, як виглядає інша сторона і де вона розташована в порівнянні з іншими об'єктами, які ви можете побачити.

GQN використовує обмежені дані для реконструкції всієї кімнати.
GQN використовує обмежені дані для реконструкції всієї кімнати.

Компанія DeepMind вважає, що подібна технологія може бути важливою у таких сферах, як самозайняті автомобілі, де система може не мати всю наявну інформацію про майбутні дорожні умови. Однак, можливо, це можна передбачити з високим ступенем точності на основі того, що він знає.

Зображення, які відображаються в GQN, дуже прості в порівнянні з реальним світом, і це займає кілька місяців, щоб швидкість роботи мережі була швидше за поточне обладнання. Це може зайняти ще кілька поколінь процесів обробки, перш ніж така система може наблизитися до розуміння та прогнозування макета складної реальної ситуації.

Читати далі

CES 2018 у фотографіях: що ми пам'ятаємо найбільше

CES завжди є переважною какофонією пам'яток і звуків, але деякі зображення завжди виділяються. Ось декілька наших фаворитів з цьогорічного шоу.

Google найманих фотографів, які допоможуть тренувати камеру з "кліпами" з підтримкою AI

Google представив цей пристрій у жовтні 2017 року, але він все ще недоступний. Найближчим часом очікується його продаж. Тепер Google детально описав, як налаштована нейронна мережа камери, щоб зрозуміти, що є важливим моментом.

Як створити власну приватну фотографію Cloud Cloud

Якщо ви хочете отримувати фотографії з будь-якої точки світу та ділитися ними з іншими людьми, не маючи витрат або потенційних конфіденційності, залишати їх у загальнодоступному хмарі, ось кілька способів зробити вашу власну приватну хмарну фотографію.

Робочий процес для мобільних фотографій: натискання конверта на Lightroom і піксель

Фотографії смартфонів легко відкинути як для випадкових стрільців. Але це швидко змінюється. Ми розглянемо, що ви можете виконати за допомогою Pixel 2, Pixelbook та Lightroom.