DeepMind будує AI, який реконструює 3D-об'єкти з однієї фотографії

DeepMind будує AI, який реконструює 3D-об'єкти з однієї фотографії

У підрозділі Google DeepMind останнім часом брали участь в деяких найпрогресивніших досягненнях компанії AI - від перемог гравців Go до розробки більш реалістичного синтезу мовлення. Тепер DeepMind намагається вдосконалити те, як машини розуміють і моделюють тривимірні простори. Дослідники DeepMind AI створили нейронну мережу, яка може передбачити, як буде виглядати простір після перегляду одного чи кількох зображень, навіть якщо видно лише частини кімнати.

В основі цього проекту лежить прагнення зробити навчання нейронних мереж легким. Зазвичай ви повинні змусити людей позначати дані, які ви використовуєте для навчання нейронної мережі. Після подання даних в, вузли в мережі обчислюють ваги і подають вперед у більше вузлів. Зрештою, вихід системи повинен відповідати тому, що ви ввели. Звичайно, це не спочатку, тому вам потрібно налаштувати мережу, поки вона не буде підготовлена. Нова генеративна мережа запитів DeepMind (GQN) може вивчати відмінні вклади та застосувати свої знання до нових ситуацій.

Команда створила 3D віртуальні простори з векторів, а потім створили їх окремі кадри для аналізу системи. GQN насправді є двома нейронними мережами - є мережа, яка вивчається зображень, а друга, яка створює нові перспективи. Команда моделювала віртуальний робочий рукоятка, блок-подібний стіл і простий лабіринт.

Після навчання GQN на мільйонах зображень, система може створювати точні уявлення про об'єкт чи кімнату лише одним нерухомим зображенням. Це схоже на те, як працює ваш мозок. Якщо ви бачите стіну посередині кімнати, ви, напевно, уявляєте собі, як виглядає інша сторона і де вона розташована в порівнянні з іншими об'єктами, які ви можете побачити.

GQN використовує обмежені дані для реконструкції всієї кімнати.
GQN використовує обмежені дані для реконструкції всієї кімнати.

Компанія DeepMind вважає, що подібна технологія може бути важливою у таких сферах, як самозайняті автомобілі, де система може не мати всю наявну інформацію про майбутні дорожні умови. Однак, можливо, це можна передбачити з високим ступенем точності на основі того, що він знає.

Зображення, які відображаються в GQN, дуже прості в порівнянні з реальним світом, і це займає кілька місяців, щоб швидкість роботи мережі була швидше за поточне обладнання. Це може зайняти ще кілька поколінь процесів обробки, перш ніж така система може наблизитися до розуміння та прогнозування макета складної реальної ситуації.

Читати далі

На сьогоднішній день приголомшливо відмінний чинник-нейтралітет висвітлюється Burger King

Burger King - так, Burger King - зробив гарненький хороший відеоролик, щоб пояснити, чим є мережевий нейтралітет, чому це важливо, і чому FCC, вбиваючи його минулого місяця, є втратою для американців.

З відкритим вихідним кодом обчислюється 20, Powers Computing, як ми це знаємо сьогодні

Програма з відкритим вихідним кодом вчора вийшла на 20 Кілька програмних концепцій можуть стверджувати, що вплинули на світ так багато.

Блокувальник реклами Chrome переходить сьогодні

Це не заблокує всіх оголошень; лише ті, які вважаються нав'язливими.

Охорона здоров'я на SXSW 2018: Завтра завтра, сьогоднішні проблеми

Витрати на охорону здоров'я в США складають приблизно 18 відсотків ВВП, збільшившись приблизно з 5 відсотків у 1960-х роках. Причини включають населення, яке старіє і живе довше. Але це також відображає систему з постійно зростаючими витратами, які практично не перевірялися, і систему, побудовану навколо постачальників послуг, а не задоволення клієнтів.