IBM побудував AI, здатний утримувати себе проти людей у дебатах
За останні кілька років AI пішов з теми ніші до вибухового поля. AI може покращити якість аудіо та відео, анімувати нерухомі зображення довготривалих людей, і ідентифікувати вас з анального. Одна річ, яку вона не змогла зробити? Ефективно сперечатися в контексті формальних дебатів.
Щоб подолати цю проблему, IBM створив проект Debate, програма розвитку AI зосереджена на тому, що це звучить. Багато проектів AI, особливо ті, хто зосереджується на іграх, мають чіткий переможець та невдаха, заснований на оцінці чисельних критеріїв, таких як фіксатори, втрачені, або співвідношення між вбивствами та смертю. Ефективно обговорює людину, вимагає значно різних наборів.
Недавній документ у природі описує результати тесту на 2019 рік між проектом Дебатер та глобально визнаний чемпіон дебатів Harish Natarajan. АІ та індивід, де обговорювалися, чи слід субсидувати дошкільну кількість. Кожна сторона було надано 15 хвилин для часу підготовки без додаткового доступу до Інтернету, який проект Debater використовувався для свого роду через власну внутрішню базу даних вмісту. Обидві сторони дали чотири хвилину мови, а потім закриває закриття закриття.
Врешті-решт, Натараян був суджений, щоб завоювати дебати, але проект Debater займав власний, утворюючи логічні заяви та аргументи протягом обговорення.
Дослідники, які розробили проект Debater, не можуть порівнювати його з іншими системами його типу. Немає ніяких. Замість цього вони використовували ПД, щоб генерувати єдину відкриту мову та порівнювали його з різними іншими методами.
На графіку нижче, "Summit" - це багатоканальна сумарна система, Speech-GPT2 - це "дрібно налаштована мовна модель", а ARG-GPT2 була створена за допомогою конкатенаційних аргументів. Arg-пошук відноситься до виступів, витягнутих за допомогою ARGUMENTEXT. Arg-Human1 та Arg-Human2 відносяться до гібридного підходу, який перевірив модуль видобутку проекту DeBater, що видобуток разом з авторством людини та перевіркою. Нарешті, виступи були включені від фахівців людини.
Графік вище показує базовий показник, де оцінка 5 вказує "сильно згоден", і оцінка 1 означає "сильно не згоден". Читачі попросили відповісти на наступне питання: "Ця мова є гарним відкритим мовою для цієї теми". Цей графік не є повним випробуванням можливостей розробки проекту - це лише оцінює відкриття виступів - але це показує, що система здатна виробляти когерентні аргументи. IBM має веб-сайт для проекту з посиланнями на видобуток, подкасті та дебатів 2019 року до дошкільних субсидій, якщо ви хочете побачити більше, як система виконується в дії.
Питання того, хто виграє дебати, завжди буде суб'єктивними, а люди, як і раніше, явно перевершує проект IBM DEBOTER. Наразі ми досі довгий шлях від даних - але ми також пройшли довгий шлях від Елізи.
Читати далі
Зразок астероїда OSIRIS-REx НАСА просочується у космос
NASA повідомляє, що зонд схопив з астероїда стільки реголіту, що він витікає з колектора. Зараз команда працює над тим, щоб визначити, як найкраще уберегти дорогоцінний вантаж від втечі.
Огляд MSI Nvidia RTX 3070 Gaming X Trio: продуктивність 2080 Ti, ціна паскаль
Новий RTX 3070 від Nvidia - це казковий графічний процесор за вигідною ціною, і MSI RTX 3070 Gaming X Trio це добре демонструє.
Нові відомості про Intel Rocket Lake: Сумісність із зворотною стороною, Xe Graphics, Cypress Cove
Intel опублікувала трохи більше інформації про Rocket Lake та його 10-нм процесор, який було перенесено назад на 14 нм.
RISC-V навшпиньки до основного потоку завдяки платформі розробників SiFive, високопродуктивний процесор
RISC V продовжує проникати на ринок, цього разу завдяки дешевшій та повнофункціональнішій тестовій материнській платі.