Nvidia представляє розмовні технології AI для розумніших ботів

Тепер, коли майже кожен можливий мобільний пристрій чи пристрій прийняв або принаймні експериментував з голосовим управлінням, розмовний AI швидко стає новим рубежем. Замість обробки одного запиту та надання однієї відповіді чи дії, розмовна AI має на меті створити інтерактивну систему в реальному часі, яка може охоплювати декілька питань, відповідей та коментарів. Хоча фундаментальні складові розмовного інтелектуального інтерфейсу, такі як BERT та RoBERTa для моделювання мови, схожі з тими для розпізнавання мовлення в один кадр, концепція поставляється з додатковими вимогами до ефективності щодо навчання, поширення та розміру моделі. Сьогодні Nvidia випустила та відкрила три технології, розроблені для вирішення цих проблем.
Швидше навчання BERT

Швидше використання мовної моделі
Для природних розмов галузевий орієнтир - 10 мс час відгуку. Розуміння запиту та відповідь на запропоновану відповідь - це лише одна частина процесу, тому для цього потрібно зайняти менше 10 мс. Оптимізувавши BERT за допомогою TensorRT 5.1, Nvidia отримала можливість зараження за 2,2 мс на Nvidia T4. Приємно, що Т4 насправді знаходиться в межах досяжності майже будь-якого серйозного проекту. Я використовував їх у Google Compute Cloud для моєї системи генерації тексту. Віртуальний сервер 4-vCPU з T4 взяв напрокат трохи більше $ 1 / годину, коли я робив проект.
Підтримка ще більших моделей
Однак, Nvidia придумала спосіб дозволити декільком графічним процесорам паралельно працювати над завданням моделювання мови. Як і в інших анонсах сьогодні, вони відкрили код, щоб зробити це. Мені буде дуже цікаво, якщо методика є специфічною для мовних моделей або може бути застосована для того, щоб дозволити багатопроцесорний тренінг для інших класів нейронних мереж.
Поряд з цими розробками та випуском коду на GitHub, Nvidia оголосила, що вони будуть співпрацювати з Microsoft для поліпшення результатів пошуку Bing, а також з Clinc на голосових агентах, Passage AI на чатах та RecordSure на розмовну аналітику.
Читати далі

Огляд MSI Nvidia RTX 3070 Gaming X Trio: продуктивність 2080 Ti, ціна паскаль
Новий RTX 3070 від Nvidia - це казковий графічний процесор за вигідною ціною, і MSI RTX 3070 Gaming X Trio це добре демонструє.

Nvidia буде імітувати пам'ять Smart Access від AMD на Ампері: звіт
Пам'ять AMD Smart Access ще навіть не надійшла, але Nvidia стверджує, що може дублювати цю функцію.

Nvidia представила графічний процесор Ampere A100 80 ГБ із пропускною здатністю 2 ТБ / с
Цього тижня Nvidia анонсувала графічний процесор Ampere A100 об'ємом 80 ГБ для розробників програмного забезпечення для штучного інтелекту, яким дійсно потрібно трохи місця для розгинання ніг.

Nvidia, Google для підтримки хмарних ігор на iPhone через веб-програми
І Nvidia, і Google оголосили про підтримку iOS своїх відповідних хмарних ігрових платформ за допомогою прогресивних веб-додатків. Apple не може цього заблокувати.