DeepMind будує AI, який реконструює 3D-об'єкти з однієї фотографії

DeepMind будує AI, який реконструює 3D-об'єкти з однієї фотографії

У підрозділі Google DeepMind останнім часом брали участь в деяких найпрогресивніших досягненнях компанії AI - від перемог гравців Go до розробки більш реалістичного синтезу мовлення. Тепер DeepMind намагається вдосконалити те, як машини розуміють і моделюють тривимірні простори. Дослідники DeepMind AI створили нейронну мережу, яка може передбачити, як буде виглядати простір після перегляду одного чи кількох зображень, навіть якщо видно лише частини кімнати.

В основі цього проекту лежить прагнення зробити навчання нейронних мереж легким. Зазвичай ви повинні змусити людей позначати дані, які ви використовуєте для навчання нейронної мережі. Після подання даних в, вузли в мережі обчислюють ваги і подають вперед у більше вузлів. Зрештою, вихід системи повинен відповідати тому, що ви ввели. Звичайно, це не спочатку, тому вам потрібно налаштувати мережу, поки вона не буде підготовлена. Нова генеративна мережа запитів DeepMind (GQN) може вивчати відмінні вклади та застосувати свої знання до нових ситуацій.

Команда створила 3D віртуальні простори з векторів, а потім створили їх окремі кадри для аналізу системи. GQN насправді є двома нейронними мережами - є мережа, яка вивчається зображень, а друга, яка створює нові перспективи. Команда моделювала віртуальний робочий рукоятка, блок-подібний стіл і простий лабіринт.

Після навчання GQN на мільйонах зображень, система може створювати точні уявлення про об'єкт чи кімнату лише одним нерухомим зображенням. Це схоже на те, як працює ваш мозок. Якщо ви бачите стіну посередині кімнати, ви, напевно, уявляєте собі, як виглядає інша сторона і де вона розташована в порівнянні з іншими об'єктами, які ви можете побачити.

GQN використовує обмежені дані для реконструкції всієї кімнати.
GQN використовує обмежені дані для реконструкції всієї кімнати.

Компанія DeepMind вважає, що подібна технологія може бути важливою у таких сферах, як самозайняті автомобілі, де система може не мати всю наявну інформацію про майбутні дорожні умови. Однак, можливо, це можна передбачити з високим ступенем точності на основі того, що він знає.

Зображення, які відображаються в GQN, дуже прості в порівнянні з реальним світом, і це займає кілька місяців, щоб швидкість роботи мережі була швидше за поточне обладнання. Це може зайняти ще кілька поколінь процесів обробки, перш ніж така система може наблизитися до розуміння та прогнозування макета складної реальної ситуації.

Читати далі

Google вбиває безкоштовне сховище фотографій, змінюючи те, що враховується до обмежень на зберігання
Google вбиває безкоштовне сховище фотографій, змінюючи те, що враховується до обмежень на зберігання

Google оголосив про деякі суттєві зміни у Фотографіях, особливо якщо ви використовуєте послугу для автоматичного резервного копіювання.

10-нм процесор Sapphire Rapids від Intel розроблений, сфотографований
10-нм процесор Sapphire Rapids від Intel розроблений, сфотографований

Intel Sapphire Rapids був помічений у дикій природі. Схоже, Intel з’єднає чіп трохи інакше, ніж AMD, принаймні на даний момент.

Глибока ностальгія оживляє ваші старі сімейні фотографії
Глибока ностальгія оживляє ваші старі сімейні фотографії

Генеалогічна фірма MyHeritage запустила Інтернет-інструмент під назвою Глибока ностальгія, який може оживити ваші старі сімейні фотографії - або насправді будь-які фотографії з обличчям. Це часом і захоплююче, і глибоко тривожно.

Хаббл, тепер 31, зачіпає приголомшливі фотографії летючої зірки
Хаббл, тепер 31, зачіпає приголомшливі фотографії летючої зірки

Фото вище показує зірку, відома як AG Carinae, яка є однією з найяскравіших у всій галактиці. Хаббл може потрапити в роки, але це все ще вражає.