Nvidia представляє розмовні технології AI для розумніших ботів

Nvidia представляє розмовні технології AI для розумніших ботів

Тепер, коли майже кожен можливий мобільний пристрій чи пристрій прийняв або принаймні експериментував з голосовим управлінням, розмовний AI швидко стає новим рубежем. Замість обробки одного запиту та надання однієї відповіді чи дії, розмовна AI має на меті створити інтерактивну систему в реальному часі, яка може охоплювати декілька питань, відповідей та коментарів. Хоча фундаментальні складові розмовного інтелектуального інтерфейсу, такі як BERT та RoBERTa для моделювання мови, схожі з тими для розпізнавання мовлення в один кадр, концепція поставляється з додатковими вимогами до ефективності щодо навчання, поширення та розміру моделі. Сьогодні Nvidia випустила та відкрила три технології, розроблені для вирішення цих проблем.

Швидше навчання BERT

Nvidia представляє розмовні технології AI для розумніших ботів

Швидше використання мовної моделі

Для природних розмов галузевий орієнтир - 10 мс час відгуку. Розуміння запиту та відповідь на запропоновану відповідь - це лише одна частина процесу, тому для цього потрібно зайняти менше 10 мс. Оптимізувавши BERT за допомогою TensorRT 5.1, Nvidia отримала можливість зараження за 2,2 мс на Nvidia T4. Приємно, що Т4 насправді знаходиться в межах досяжності майже будь-якого серйозного проекту. Я використовував їх у Google Compute Cloud для моєї системи генерації тексту. Віртуальний сервер 4-vCPU з T4 взяв напрокат трохи більше $ 1 / годину, коли я робив проект.

Підтримка ще більших моделей

Однак, Nvidia придумала спосіб дозволити декільком графічним процесорам паралельно працювати над завданням моделювання мови. Як і в інших анонсах сьогодні, вони відкрили код, щоб зробити це. Мені буде дуже цікаво, якщо методика є специфічною для мовних моделей або може бути застосована для того, щоб дозволити багатопроцесорний тренінг для інших класів нейронних мереж.

Поряд з цими розробками та випуском коду на GitHub, Nvidia оголосила, що вони будуть співпрацювати з Microsoft для поліпшення результатів пошуку Bing, а також з Clinc на голосових агентах, Passage AI на чатах та RecordSure на розмовну аналітику.

Читати далі

EKWB представляє кулер Пельтьє на базі технології охолодження Intel Cryo
EKWB представляє кулер Пельтьє на базі технології охолодження Intel Cryo

Intel і EKWB спільно оголосили про новий водяний блок, який інтегрує кулер Пельтьє.

Asus представляє Chromebox 4 з підтримкою ядерних процесорів 10-го покоління
Asus представляє Chromebox 4 з підтримкою ядерних процесорів 10-го покоління

У наш час комп’ютерів Chromebook настільки багато, що вони могли б рости на деревах. Chromeboxes стає менше, але Asus постійно оновлює свою лінійку і щойно оголосив про останню версію.

Seagate представляє власні ядра RISC-V для майбутніх контролерів зберігання
Seagate представляє власні ядра RISC-V для майбутніх контролерів зберігання

Щоб досягти своєї мети в 50 ТБ на диск протягом наступних кількох років, Seagate вирішила, що потрібен спеціальний контролер зберігання. RISC-V запропонував рішення.

Розробник Star Citizen представляє нову дорожню карту, скасовує ескадрилью 42 Beta
Розробник Star Citizen представляє нову дорожню карту, скасовує ескадрилью 42 Beta

Cloud Imperium Games скасувала бета-версію Squadron 42, яка повинна була дебютувати до кінця 2020 року, не маючи поточного плану або графіку її запуску.