IBM построил AI, способный провести свои собственные люди в дебатах
За последние несколько лет AI отправился от нишевой темы к взрывому поле. AI может улучшить качество звука и видео, анимировать неподвижные изображения длинных мертвых людей и идентифицировать вас от анализа. Одна вещь, которую он не смог сделать? Эффективно спорить в контексте официальных дискуссий.
Чтобы преодолеть эту проблему, IBM создал программу проекта, программа разработки AI сосредоточена на том, что она звучит. Многие проекты AI, особенно те, которые сосредотачиваются на играх, имеют четкий победитель и неудачник, основанный на оценке численных критериев, таких как захваченные произведения, теряющиеся жизни, или соотношение между убийствами и смертью. Эффективно обсуждение человека требует значительно другого набора навыков.
Недавняя статья в природе описывается результаты испытания на 2019 год между проектной службой и глобально признанным чемпионом дебатов Harish Natarajan. АИ и индивидуальные обсуждали, должны ли дошкольника субсидироваться. Каждая сторона была предоставлена 15 минут для получения приготовления без дополнительного доступа в Интернет, в котором программа проекта используется для сортировки через собственную внутреннюю базу данных контента. Обе стороны давали через четыреминутное речь, а затем двухминутное заявление закрытия.
В конечном счете, Натараджан был оценен, чтобы выиграл дебаты, но проектные услуги провели свои собственные, формирующие логические заявления и аргументы в течение обсуждения.
Исследователи, которые разработали разработанные проектные услуги, не могут сравнить его с другими системами своего типа. Там нет. Вместо этого они использовали PD для создания одной открытия речи и сравнивали его против различных других методов.
На графике ниже «Summit» представляет собой многопользовательскую сводную систему, речь-GPT2 - «тонко настраиваемая языковая модель», и Arg-GPT2 был создан с использованием объединенных аргументов. ARG-Search относится к речам, извлеченным с помощью аргумента. Arg-Human1 и Arg-Human2 Обратитесь к гибридным подходу, который проверил модуль добычи доступа к аргументу проекта, рядом с человеком авторства и проверки. Наконец, выступления были включены из человеческих экспертов.
График выше показывает базовую оценку, где оценка 5 указывает на «решительно согласен», а счет 1 означает «категорически не согласен». Читатели попросили ответить на следующий вопрос: «Эта речь - хорошая открывая речь для этой темы». Этот график не является полным испытанием возможностей проекта DEBATER - он оценивает только выступления в открытие - но это демонстрирует, что система способна создавать согласованные аргументы. IBM имеет веб-сайт для проекта со ссылками на белые стороны, подкасты и дебаты 2019 года на дошкольных субсидиях, если вы хотите увидеть больше того, как система выполняется в действии.
Вопрос о том, кто победит в дебатах, всегда будет субъективным, и люди все еще четко превзолируют проект IBM. На данный момент мы все еще долгий путь от данных - но мы тоже дали долгий путь от Eliza.