Новий інструмент OpenAI перетворює текст на 3D -моделі

Новий інструмент OpenAI перетворює текст на 3D -моделі

Для інновацій незвично робити однаково великі хвилі в мистецтві та штучному інтелекту, але це те, що OpenAi здійснив з випуском генератора зображень Dall-E. Просто введіть опис, і Dall-E може зробити його реальним. Новий алгоритм компанії має подібний крок, але замість того, щоб робити 2D-зображення, Point-E створює 3D-модель вашого опису.

Point-E не йде прямо від тексту до 3D-сітки-вона фактично складається з двох різних моделей AI. По-перше, AI текстового зображення обробляє підказку, щоб зробити стандартне 2D-зображення. Потім AI Image to-3D перекинувся в дію, щоб перетворити плоску передачу на 3D-модель. Отже, якби ви попросили Point-E зробити конус дорожнього руху, він розпочнеться з трикутника стриптизму. Другий ШІ повинен зрозуміти, що конуси дорожнього руху - це шишки для отримання правильної 3D -форми.

Це не зовсім нова ідея - Google має інструмент під назвою DreamFusion, який може зробити щось подібне. Однак DreamFusion був розроблений для запуску на машині з чотирма спеціальними процесорами TPU V4 AI, і для створення зображення потрібно це обладнання 90 хвилин. Ви дивитесь на кілька годин часу GPU за зображенням з мрією. Point-E набагато швидше, і він може працювати на комп’ютері з одним GPU.

Багато хто з нас провели вибух, який сказав Далл-е, щоб зробити позаду стіни, але Point-E ще не готовий до цього миттєвого задоволення. Дослідження пояснює, що це перший крок у фундаментальній технології, який з часом може стати таким же швидким і легким, як і Далл-е. OpenAi каже, що Point-E досі не вистачає комерційного 3D-моделювання-результати більше схожі на хмару очок.

Новий інструмент OpenAI перетворює текст на 3D -моделі

При згладжуванні та обробці моделі Point-E можуть створювати прохідне зображення реального об'єкта, як видно вище. Справжній стрибок тут - це ефективність, за якою OpenAi стверджує, що "один -два порядки швидше", ніж існуючі системи. Можливо, в майбутньому Point-E втрутиться в домен 3D-моделювання того, як Дал-Е має в мистецтві. Нещодавно Adobe вирішив, що дозволить мистецтву, що генерує AI у своїй бібліотеці зображень, якій не всім художникам подобається.

Якщо ви хочете повторити з точкою-E, весь код доступний на Github. Однак вам потрібно буде мати Python, а також певний досвід програмування та інструментів командного рядка, щоб він працював. Однак відносно скромні апаратні вимоги означають, що він доступніший, ніж DreamFusion.

Читати далі

Нова серія Radeon RX 6000 від AMD оптимізована для бойового ампера
Нова серія Radeon RX 6000 від AMD оптимізована для бойового ампера

AMD сьогодні представила свою серію RX 6000. Вперше з моменту придбання ATI в 2006 році, існуватимуть певні переваги в роботі графічних процесорів AMD на платформах AMD.

Нові відомості про Intel Rocket Lake: Сумісність із зворотною стороною, Xe Graphics, Cypress Cove
Нові відомості про Intel Rocket Lake: Сумісність із зворотною стороною, Xe Graphics, Cypress Cove

Intel опублікувала трохи більше інформації про Rocket Lake та його 10-нм процесор, який було перенесено назад на 14 нм.

RISC-V навшпиньки до основного потоку завдяки платформі розробників SiFive, високопродуктивний процесор
RISC-V навшпиньки до основного потоку завдяки платформі розробників SiFive, високопродуктивний процесор

RISC V продовжує проникати на ринок, цього разу завдяки дешевшій та повнофункціональнішій тестовій материнській платі.

Intel випускає нові мобільні графічні процесори Xe Max для творців вмісту початкового рівня
Intel випускає нові мобільні графічні процесори Xe Max для творців вмісту початкового рівня

Intel випустила новий споживчий мобільний графічний процесор, але він має дуже конкретний варіант використання, принаймні зараз.