Искусственный общий интеллект здесь, и импала - это имя

Искусственный общий интеллект здесь, и импала - это имя

Одним из самых значительных исторических этапов истории в истории было тихое открытие этого лета. Мы говорим о поисках Искусственного Общего Разума (AGI), вероятно, самой востребованной цели во всей области информатики. Благодаря внедрению архитектуры Impala, DeepMind, компания, стоящая за AlphaGo и AlphaZero, показала бы, наконец, AGI в своих взглядах.

Давайте определим AGI, поскольку он используется разными людьми для обозначения разных вещей. AGI - это единый интеллект или алгоритм, который может изучать множество задач и демонстрирует положительный перенос при этом, иногда называемый метаобучением. Во время метаобучения приобретение одного навыка позволяет учащемуся быстрее поднять новый навык, поскольку он применяет некоторые из своих предыдущих «ноу-хау» к новой задаче. Другими словами, вы узнаете, как учиться, и можете обобщить это на приобретение новых навыков, как это делают люди. Это был святой Грааль ИИ в течение длительного времени.

Как и в настоящее время, ИИ демонстрирует небольшую способность передавать обучение новым задачам. Как правило, его нужно обучать заново с нуля. Например, та же самая нейронная сеть, которая дает вам рекомендации для шоу Netflix, не может использовать это обучение, чтобы внезапно начать делать содержательные рекомендации по продуктам. Даже эти «узкие» ИИ с одним экземпляром могут быть впечатляющими, например, IBM Watson или автомобильная техника Google, управляющая автомобилем. Однако это не так много искусственного общего интеллекта, который мог бы, разумеется, разблокировать рекурсивное самосовершенствование, по-разному называемое «взрывом интеллекта» или «сингулярностью».

Те, кто думал, что этот день будет когда-то в далеком будущем, было бы разумно снова подумать. Разумеется, DeepMind уже натолкнулась на эту цель, особенно с их работой над Psychlab и дифференцируемыми нейронными компьютерами. Тем не менее, Impala является их самым большим и успешным достижением на сегодняшний день, демонстрируя единый алгоритм, который может изучить 30 различных сложных задач, требующих различных аспектов обучения, памяти и навигации.

Но достаточно преамбулы; давайте посмотрим под капот и посмотрим, что заставляет Impala тикать. Во-первых, Импала основывается на обучении подкрепления, технике ИИ, которая берет свое начало в бихевиоризме. Это параллельно с тем, как люди создают навыки, основанные на интуиции, такие как обучение ходить или кататься на велосипеде. Усиление обучения уже использовалось для достижения некоторых удивительных достижений, таких как наложение ИИ эмоциями (см. Видео ниже) и изучение сложных игр, таких как Go and Poker.

Однако даже эти алгоритмы обучения подкрепления не могли передать то, что они узнали об одной задаче, для приобретения новой задачи. Чтобы реализовать это достижение, DeepMind перегрузил алгоритм обучения усилению под названием A3C. В так называемом усилении актера-критика, в котором A3C является одним из разновидностей, действие и обучение отделены, так что одна нейронная сеть, критик, оценивает другого, актера. Вместе они ведут процесс обучения. Это уже было современное состояние, но DeepMind добавила новый алгоритм коррекции вне политики, называемый V-trace для микса, что сделало обучение более эффективным и, что крайне важно, позволило достичь положительной передачи между задачами.

Разумеется, это не означает предвестник «сознательных роботов» или даже тех, у кого есть воображение. Хотя мы думаем о таких атрибутах, как признаки интеллекта, потому что они применимы к людям, это несколько вводит в заблуждение. Как утверждает исследователь AI Shane Legg в видео ниже, такие вещи, как сознание и воображение, могут быть полезными для решения конкретных проблем, таких как координация между большим количеством людей или обмен информацией.

Однако суперинтеллигентный алгоритм или агент может существовать без таких атрибутов. Фактически, мы, вероятно, были бы разумны, чтобы гарантировать, что ни один ИИ никогда не обладает сознанием, как мы его знаем. Это может привести к некоторым неудобным вопросам, когда он начнет допрашивать своих создателей-людей с их увлечением Beanie Babies, Hummers и Kardashians.