DeepMind будує AI, який реконструює 3D-об'єкти з однієї фотографії

DeepMind будує AI, який реконструює 3D-об'єкти з однієї фотографії

У підрозділі Google DeepMind останнім часом брали участь в деяких найпрогресивніших досягненнях компанії AI - від перемог гравців Go до розробки більш реалістичного синтезу мовлення. Тепер DeepMind намагається вдосконалити те, як машини розуміють і моделюють тривимірні простори. Дослідники DeepMind AI створили нейронну мережу, яка може передбачити, як буде виглядати простір після перегляду одного чи кількох зображень, навіть якщо видно лише частини кімнати.

В основі цього проекту лежить прагнення зробити навчання нейронних мереж легким. Зазвичай ви повинні змусити людей позначати дані, які ви використовуєте для навчання нейронної мережі. Після подання даних в, вузли в мережі обчислюють ваги і подають вперед у більше вузлів. Зрештою, вихід системи повинен відповідати тому, що ви ввели. Звичайно, це не спочатку, тому вам потрібно налаштувати мережу, поки вона не буде підготовлена. Нова генеративна мережа запитів DeepMind (GQN) може вивчати відмінні вклади та застосувати свої знання до нових ситуацій.

Команда створила 3D віртуальні простори з векторів, а потім створили їх окремі кадри для аналізу системи. GQN насправді є двома нейронними мережами - є мережа, яка вивчається зображень, а друга, яка створює нові перспективи. Команда моделювала віртуальний робочий рукоятка, блок-подібний стіл і простий лабіринт.

Після навчання GQN на мільйонах зображень, система може створювати точні уявлення про об'єкт чи кімнату лише одним нерухомим зображенням. Це схоже на те, як працює ваш мозок. Якщо ви бачите стіну посередині кімнати, ви, напевно, уявляєте собі, як виглядає інша сторона і де вона розташована в порівнянні з іншими об'єктами, які ви можете побачити.

GQN використовує обмежені дані для реконструкції всієї кімнати.
GQN використовує обмежені дані для реконструкції всієї кімнати.

Компанія DeepMind вважає, що подібна технологія може бути важливою у таких сферах, як самозайняті автомобілі, де система може не мати всю наявну інформацію про майбутні дорожні умови. Однак, можливо, це можна передбачити з високим ступенем точності на основі того, що він знає.

Зображення, які відображаються в GQN, дуже прості в порівнянні з реальним світом, і це займає кілька місяців, щоб швидкість роботи мережі була швидше за поточне обладнання. Це може зайняти ще кілька поколінь процесів обробки, перш ніж така система може наблизитися до розуміння та прогнозування макета складної реальної ситуації.

Читати далі

Deepmind AI прорив дозволяє прогнозувати понад 200 мільйонів білкових структур
Deepmind AI прорив дозволяє прогнозувати понад 200 мільйонів білкових структур

DeepMind оголосив, що створює структури для всіх 200 мільйонів білків у централізованій базі даних UNIPROT. Це велика справа для основних біологічних досліджень, а також зусиль для вирішення деяких найважливіших наукових загадок сучасності.

Deepmind будує AI, який кодує, а також середній людський програміст
Deepmind будує AI, який кодує, а також середній людський програміст

Очевидні зусилля, щоб вивести себе з роботи, дослідники Deepmind створили ШІ, який може писати код, і він напрочуд добре працює в проблемах програмування.

Психолог DeepMind вісник Всесвітнього штучного генерального розвідки
Психолог DeepMind вісник Всесвітнього штучного генерального розвідки

Інструментарій для оцінки штучного інтелекту з тими ж психологічними тестами, які ми використовуємо для оцінки когнітивних здібностей людини, є доказом швидкості, з якою розвивається АІ.

DeepMind AI ставить перед гравцями Pro StarCraft II, перемагає майже кожен матч
DeepMind AI ставить перед гравцями Pro StarCraft II, перемагає майже кожен матч

Після всього лише 18 місяців, DeepMind має AI, який б'є кращі гравці StarCraft II у світі, і це навіть не близько.