MIT створив робота, який переглядає 3D-об'єкти на дотик

Хоча AI продовжує стрімко розвиватися, ми все ще маємо довгий шлях уперед при розробці необхідних сенсорів для перекладу фізичного світу на дані, які може зрозуміти комп'ютер. У той час як зір та звук мали трохи поштовху, наші інші почуття мали мало практичних застосувань у цифровому світі, але це не стосується роботів.

MIT нещодавно створив нового робота з використанням сенсорів GelSight, які дозволяють йому бачити об'єкти, до яких він торкається, і створювати 3D-карту текстури, щоб краще зрозуміти її. Наведене нижче відео демонструє, як технологія GelSight, яка зазвичай використовується для аерокосмічних застосувань, може «побачити» те, до чого вона торкається.

GelSight, безумовно, пропонує вражаючі, докладні засоби перекладу реального світу в цифрову інформацію. Але це не робить розумний робот - лише деякі дуже пізнавальні пальці, які вимагають контролю від інтелекту. MIT побачив цей потенціал і створив робота з AI-моделлю, що тренується на об'єктах, до яких він торкається, використовуючи детальні тривимірні карти, створені датчиками GelSight. Хоча робот насправді не бачить, що він торкається в традиційному, оптичному сенсі, він отримує стільки даних через свої датчики, що він може перевести ці дані у візуальну інформацію і вчитися у неї так само, як і будь-яка звичайна, орієнтована на зображення згорткова нейронна мережа ( CNN).

Робот MIT був навчений 12 000 відеозаписів сенсорних даних сенсора GelSight, розбитих на рамки нерухомих зображень, з 200 предметів побуту. У поєднанні з тактильними даними, робот може зрозуміти, до чого торкаються його сенсори. У розмові з Engadget, CSAIL Ph.D. студент і провідний автор цього проекту, пояснили, що їхня система може досягти зараз:

“Подивившись на сцену, наша модель може уявити відчуття дотику до плоскої поверхні або гострого краю. Сліпо торкаючись навколо, наша модель може передбачити взаємодію з навколишнім середовищем виключно з тактильних почуттів. Об'єднання цих двох органів почуттів може дозволити роботові і зменшити дані, які нам можуть знадобитися для виконання завдань, пов'язаних з маніпулюванням і захопленням об'єктів.

Хоча ще на початковій стадії, система MIT працює досить добре, і це пов'язано з їхнім підходом. Багато дослідників та розробників AI створюють моделі, засновані на тому, як працює мозок людини, але це часто не має великого сенсу. У деяких випадках ми хочемо, щоб AI функціонував як людина, оскільки його мета полягає в тому, щоб наблизити нас або допомогти нам дізнатися більше про себе, імітуючи людські процеси. У більшості інших випадків, однак, наближення розвитку штучного інтелекту шляхом запровадження людської структури заперечує безліч переваг, які можуть запропонувати комп'ютерні програми та обладнання.

MIT вирішив використовувати датчик набагато більш точним і здатним, ніж будь-яка людина, може наблизитися і використовувати обчислювальну потужність, доступну AI. Здійснюючи вибір, який використовує переваги комп'ютерів, а не примушує людський підхід, вони створили робота, який має потенціал перевершити людей у задачах ідентифікації сліпих дотиків. У конкретних випадках це вже досягається.

Хоча це може здатися не найважливішою проблемою для вирішення, дотик дійсно відіграє важливу роль у робототехніці. Ніші програми можуть скористатися перевагою роботизованої здатності відчувати різницю між бавовною і нейлоном, але більш широкі програми мають набагато більше пропозицій. Роботу без відчуття дотику всі об'єкти відчувають себе однаково. Вона могла б зрозуміти деякі речі візуально, але це досить рідко корисно.

Подумайте, як ви пройдете свій день, якби все, що ви торкнулися, відчули те ж саме - або, точніше, не відчували, що взагалі нічого. Ви не знаєте, яку силу використовувати під час підключення кабелю. Ви не мали б можливості зрозуміти практичні відмінності між друкованим зображенням самого наждачного паперу та наждачним папером.

Надаючи роботові відчуття дотику і здатність вчитися на ньому, цей робот може краще судити про матеріали, до яких він торкається. Він може вчитися швидше і точніше, ніж можна просто з стандартних зображень. Потім вона може використовувати цю інформацію для коригування своїх дій відповідно до матеріалів, які вона обробляє, або, принаймні, ідеальної мети на майбутнє. Якщо роботи розуміють дотик, вони створюють менше ризику ненавмисного пошкодження. Зараз, якщо ви зобов'язані найбільш розумним роботам носити водяну кулю, вони б не знали, як утримувати її, не руйнуючи її. Відчуття дотику дає роботам можливість, через добре підготовлену AI-модель, розпізнати, як обробляти різні типи об'єктів і діяти відповідно.

Хоча MIT лише створив початок компонента кращих, розумніших роботів, це ще один хороший крок у правильному напрямку. Робот, розроблений для розуміння і включення даних, що набуваються за допомогою дотику, має набагато кращі наслідки для загальної безпеки, ніж той, який він не має. Такі події створюють гарантії проти потенційних аварій.

Кредит верхнього зображення: Фото Франка В. Про Unsplash

Читати далі

AMD збиває рекорди доходу як Zen 3, Xbox Series X, PS5 Ramp Up

Результати AMD у третьому кварталі 2020 року є, і результати в кожному конкретному випадку відмінні для компанії.

Samsung, Стенфорд, побудував 10 000 PPI дисплей, який міг би змінити VR, AR

Запитайте тих, хто провів у гарнітурі VR більше кількох хвилин, і вони згадають про ефект дверей на екрані. Це може назавжди його усунути.

Астрономи виявили планету-шахраю, яка блукає по Галактиці, розміром із землю

Астрономи ідентифікували понад 4000 екзопланет, що обертаються навколо інших зірок, але лише кілька "планет-шахраїв", які блукають по галактиці без зірки, щоб подзвонити додому. Нове дослідження стверджує, що помітило один із цих світів, і це може бути маленький кам’янистий світ, такий як Земля.

RISC-V навшпиньки до основного потоку завдяки платформі розробників SiFive, високопродуктивний процесор

RISC V продовжує проникати на ринок, цього разу завдяки дешевшій та повнофункціональнішій тестовій материнській платі.