Новий інструмент OpenAI перетворює текст на 3D -моделі

Новий інструмент OpenAI перетворює текст на 3D -моделі

Для інновацій незвично робити однаково великі хвилі в мистецтві та штучному інтелекту, але це те, що OpenAi здійснив з випуском генератора зображень Dall-E. Просто введіть опис, і Dall-E може зробити його реальним. Новий алгоритм компанії має подібний крок, але замість того, щоб робити 2D-зображення, Point-E створює 3D-модель вашого опису.

Point-E не йде прямо від тексту до 3D-сітки-вона фактично складається з двох різних моделей AI. По-перше, AI текстового зображення обробляє підказку, щоб зробити стандартне 2D-зображення. Потім AI Image to-3D перекинувся в дію, щоб перетворити плоску передачу на 3D-модель. Отже, якби ви попросили Point-E зробити конус дорожнього руху, він розпочнеться з трикутника стриптизму. Другий ШІ повинен зрозуміти, що конуси дорожнього руху - це шишки для отримання правильної 3D -форми.

Це не зовсім нова ідея - Google має інструмент під назвою DreamFusion, який може зробити щось подібне. Однак DreamFusion був розроблений для запуску на машині з чотирма спеціальними процесорами TPU V4 AI, і для створення зображення потрібно це обладнання 90 хвилин. Ви дивитесь на кілька годин часу GPU за зображенням з мрією. Point-E набагато швидше, і він може працювати на комп’ютері з одним GPU.

Багато хто з нас провели вибух, який сказав Далл-е, щоб зробити позаду стіни, але Point-E ще не готовий до цього миттєвого задоволення. Дослідження пояснює, що це перший крок у фундаментальній технології, який з часом може стати таким же швидким і легким, як і Далл-е. OpenAi каже, що Point-E досі не вистачає комерційного 3D-моделювання-результати більше схожі на хмару очок.

Новий інструмент OpenAI перетворює текст на 3D -моделі

При згладжуванні та обробці моделі Point-E можуть створювати прохідне зображення реального об'єкта, як видно вище. Справжній стрибок тут - це ефективність, за якою OpenAi стверджує, що "один -два порядки швидше", ніж існуючі системи. Можливо, в майбутньому Point-E втрутиться в домен 3D-моделювання того, як Дал-Е має в мистецтві. Нещодавно Adobe вирішив, що дозволить мистецтву, що генерує AI у своїй бібліотеці зображень, якій не всім художникам подобається.

Якщо ви хочете повторити з точкою-E, весь код доступний на Github. Однак вам потрібно буде мати Python, а також певний досвід програмування та інструментів командного рядка, щоб він працював. Однак відносно скромні апаратні вимоги означають, що він доступніший, ніж DreamFusion.

Читати далі

Позиціонування M1 Apple знущається по всій бізнес-моделі X86
Позиціонування M1 Apple знущається по всій бізнес-моделі X86

Apple розташовує свою M1 зовсім інакше, від будь-якого процесора Intel або AMD випустила. Довгостроковий вплив на ринок ПК може бути значним.

Kirin 990 SoC Huawei - це перший чіп із вбудованим 5G-модемом
Kirin 990 SoC Huawei - це перший чіп із вбудованим 5G-модемом

Huawei анонсував свої SoCs Kirin 990 та Kirin 990 5G. Huawei стане першою фірмою, яка поставить інтегрований 5G-модем, хоча це добре чи ні, відкриті для обговорення.

Дослідники використовують 3D-моделювання клімату для оцінки життєздатності планети
Дослідники використовують 3D-моделювання клімату для оцінки життєздатності планети

Коли астрономи припускають, що екзопланета може бути заселеною, це дуже приблизна оцінка. Нове дослідження - це перше, що використовує 3D-моделювання клімату, щоб допомогти нігтям, які екзопланети могли підтримати життя.

MediaTek оголошує чіп розміром 1000 ARM із вбудованим 5G-модемом
MediaTek оголошує чіп розміром 1000 ARM із вбудованим 5G-модемом

Компанія оголосила про свою нову систему Dimensity 1000 на чіпі (SoC) з останніми ядрами процесора ARM та інтегрованим 5G-модемом. Однак це не працюватиме на деяких основних 5G-діапазонах, що працюють у США.