DeepMind будує AI, який реконструює 3D-об'єкти з однієї фотографії

DeepMind будує AI, який реконструює 3D-об'єкти з однієї фотографії

У підрозділі Google DeepMind останнім часом брали участь в деяких найпрогресивніших досягненнях компанії AI - від перемог гравців Go до розробки більш реалістичного синтезу мовлення. Тепер DeepMind намагається вдосконалити те, як машини розуміють і моделюють тривимірні простори. Дослідники DeepMind AI створили нейронну мережу, яка може передбачити, як буде виглядати простір після перегляду одного чи кількох зображень, навіть якщо видно лише частини кімнати.

В основі цього проекту лежить прагнення зробити навчання нейронних мереж легким. Зазвичай ви повинні змусити людей позначати дані, які ви використовуєте для навчання нейронної мережі. Після подання даних в, вузли в мережі обчислюють ваги і подають вперед у більше вузлів. Зрештою, вихід системи повинен відповідати тому, що ви ввели. Звичайно, це не спочатку, тому вам потрібно налаштувати мережу, поки вона не буде підготовлена. Нова генеративна мережа запитів DeepMind (GQN) може вивчати відмінні вклади та застосувати свої знання до нових ситуацій.

Команда створила 3D віртуальні простори з векторів, а потім створили їх окремі кадри для аналізу системи. GQN насправді є двома нейронними мережами - є мережа, яка вивчається зображень, а друга, яка створює нові перспективи. Команда моделювала віртуальний робочий рукоятка, блок-подібний стіл і простий лабіринт.

Після навчання GQN на мільйонах зображень, система може створювати точні уявлення про об'єкт чи кімнату лише одним нерухомим зображенням. Це схоже на те, як працює ваш мозок. Якщо ви бачите стіну посередині кімнати, ви, напевно, уявляєте собі, як виглядає інша сторона і де вона розташована в порівнянні з іншими об'єктами, які ви можете побачити.

GQN використовує обмежені дані для реконструкції всієї кімнати.
GQN використовує обмежені дані для реконструкції всієї кімнати.

Компанія DeepMind вважає, що подібна технологія може бути важливою у таких сферах, як самозайняті автомобілі, де система може не мати всю наявну інформацію про майбутні дорожні умови. Однак, можливо, це можна передбачити з високим ступенем точності на основі того, що він знає.

Зображення, які відображаються в GQN, дуже прості в порівнянні з реальним світом, і це займає кілька місяців, щоб швидкість роботи мережі була швидше за поточне обладнання. Це може зайняти ще кілька поколінь процесів обробки, перш ніж така система може наблизитися до розуміння та прогнозування макета складної реальної ситуації.

Читати далі

Samsung, Стенфорд, побудував 10 000 PPI дисплей, який міг би змінити VR, AR
Samsung, Стенфорд, побудував 10 000 PPI дисплей, який міг би змінити VR, AR

Запитайте тих, хто провів у гарнітурі VR більше кількох хвилин, і вони згадають про ефект дверей на екрані. Це може назавжди його усунути.

PlayStation 5 буде доступний в Інтернеті лише на день запуску
PlayStation 5 буде доступний в Інтернеті лише на день запуску

PlayStation 5 не буде доступний у магазинах у день запуску, і якщо ви хочете взяти твердотільний накопичувач M.2, щоб розширити його обсяг пам’яті, у вас буде трохи часу, щоб зрозуміти цю покупку.

Як побудувати детектор маски для обличчя за допомогою Jetson Nano 2GB та AlwaysAI
Як побудувати детектор маски для обличчя за допомогою Jetson Nano 2GB та AlwaysAI

Nvidia продовжує робити ШІ на межі доступнішим та простішим у розгортанні. Тому, замість того, щоб просто переглядати еталони, щоб переглянути новий Jetson Nano 2 Гб, я вирішив взятися за проект DIY зі створення власного детектора маски для обличчя.

Nvidia буде імітувати пам'ять Smart Access від AMD на Ампері: звіт
Nvidia буде імітувати пам'ять Smart Access від AMD на Ампері: звіт

Пам'ять AMD Smart Access ще навіть не надійшла, але Nvidia стверджує, що може дублювати цю функцію.