Nvidia представляє розмовні технології AI для розумніших ботів

Nvidia представляє розмовні технології AI для розумніших ботів

Тепер, коли майже кожен можливий мобільний пристрій чи пристрій прийняв або принаймні експериментував з голосовим управлінням, розмовний AI швидко стає новим рубежем. Замість обробки одного запиту та надання однієї відповіді чи дії, розмовна AI має на меті створити інтерактивну систему в реальному часі, яка може охоплювати декілька питань, відповідей та коментарів. Хоча фундаментальні складові розмовного інтелектуального інтерфейсу, такі як BERT та RoBERTa для моделювання мови, схожі з тими для розпізнавання мовлення в один кадр, концепція поставляється з додатковими вимогами до ефективності щодо навчання, поширення та розміру моделі. Сьогодні Nvidia випустила та відкрила три технології, розроблені для вирішення цих проблем.

Швидше навчання BERT

Nvidia представляє розмовні технології AI для розумніших ботів

Швидше використання мовної моделі

Для природних розмов галузевий орієнтир - 10 мс час відгуку. Розуміння запиту та відповідь на запропоновану відповідь - це лише одна частина процесу, тому для цього потрібно зайняти менше 10 мс. Оптимізувавши BERT за допомогою TensorRT 5.1, Nvidia отримала можливість зараження за 2,2 мс на Nvidia T4. Приємно, що Т4 насправді знаходиться в межах досяжності майже будь-якого серйозного проекту. Я використовував їх у Google Compute Cloud для моєї системи генерації тексту. Віртуальний сервер 4-vCPU з T4 взяв напрокат трохи більше $ 1 / годину, коли я робив проект.

Підтримка ще більших моделей

Однак, Nvidia придумала спосіб дозволити декільком графічним процесорам паралельно працювати над завданням моделювання мови. Як і в інших анонсах сьогодні, вони відкрили код, щоб зробити це. Мені буде дуже цікаво, якщо методика є специфічною для мовних моделей або може бути застосована для того, щоб дозволити багатопроцесорний тренінг для інших класів нейронних мереж.

Поряд з цими розробками та випуском коду на GitHub, Nvidia оголосила, що вони будуть співпрацювати з Microsoft для поліпшення результатів пошуку Bing, а також з Clinc на голосових агентах, Passage AI на чатах та RecordSure на розмовну аналітику.

Читати далі

EKWB представляє кулер Пельтьє на базі технології охолодження Intel Cryo
EKWB представляє кулер Пельтьє на базі технології охолодження Intel Cryo

Intel і EKWB спільно оголосили про новий водяний блок, який інтегрує кулер Пельтьє.

Quake II RTX тепер працює на графічних процесорах AMD завдяки технології відстеження променів Vulkan
Quake II RTX тепер працює на графічних процесорах AMD завдяки технології відстеження променів Vulkan

Nvidia Quake II RTX тепер працює на графічних процесорах AMD за допомогою Vulkan, якщо у вас є правильний драйвер (і RX 6000).

Гарвардський астроном досі вважає, що міжзоряний об'єкт був чужою технологією
Гарвардський астроном досі вважає, що міжзоряний об'єкт був чужою технологією

Вчені класифікували `` Оумуамуа '' по-різному як астероїд або комету, але Аві Льоб, голова департаменту астрономії Гарварда, вважає, що це було насправді чужорідним - частиною інопланетної технології, яку ми прийняли за природну космічну скелю.

Intel Records Record-Breaking 2020 створить "Найбільшу кількість" 7-нм у власних технологіях
Intel Records Record-Breaking 2020 створить "Найбільшу кількість" 7-нм у власних технологіях

Intel побила рекорди доходів за весь 2020 рік і побачила зростання продажів клієнтських обчислень за цей рік. Він не дав точної специфікації на 7 нм, але нас поінформував про широку форму речей.