Додаток Microsoft «Див. AI» тепер досліджує фотографії з сенсорним, сподіваюся, не буде забито

Корпорація Майкрософт опублікувала значне оновлення для своєї програми з використанням AI для людей з вадами зору. Призначений для сліпих або тих, хто має слабкий зір, Seeing AI має список функціональних можливостей, які, очевидно, мають на меті забезпечити широкий спектр можливостей. Це останнє оновлення нібито додає можливість вивчати вже зроблені фотографії на дотик. AI використовується для аналізу сцени та відображення конкретних об'єктів у фото. Проведіть пальцем по зображенню, і телефон виявить, які об'єкти ви знаходитесь поруч, і ідентифікуйте їх вам.

Якщо ви навіть коли-небудь намагалися використовувати програму для читання з екрана, ви, мабуть, знаєте, наскільки погано технологія відображає сучасний спосіб використання комп'ютерів. Хоча вони працюють досить добре для деяких програм, читачі екрана не дуже легко відображаються в сучасному Інтернеті. Ряд авторів з доступності говорили на цю тему досить добре. Суть полягає в тому, що допоміжні технології могли б абсолютно використовувати імпульс. Я перевірив Побачивши AI, сподіваючись, що це вкаже шлях до кращого майбутнього. Провівши деякий час з нею, я б сказав, що він має справжню обіцянку і деякі проблеми, які змушують рекомендувати як надійного джерела інформації саме зараз. Враховуючи, що вся мета програми полягає в тому, щоб визначити речі, які можуть бути цікавими.

Бачачи, що AI використовує камеру телефону + штучний інтелект, щоб визначити, що він «бачить».

Короткий текст
Документ
Продукт (сканування штрих-кодів)
Людина (можна навчити розпізнавати окремих людей)
Валюта
Сцена
Колір
Рукописний текст
Світло (використовує звукові сигнали, щоб повідомити вам, коли камера вказана на найяскравіше джерело світла, яке він може бачити)

Функція ідентифікації та аналізу фотографій була головною, яку ми хотіли сьогодні протестувати, тому що це додало Microsoft з цим оновленням, але ми також взяли інші функції для обертання. Додаток працює досить добре на виявленні документів і тексту, особливо якщо ви використовуєте білий фон. Ми не змогли правильно визначити штрих-коди продуктів; цей аспект програми завжди не вдалося з повідомленням "Вибачте, щось пішло не так". Коли ми спробували скористатися функцією «Сцена», система зазвичай невірно ідентифікувала меблі, наприклад, помилкове прибирання комода для столу.

Що стосується фотозйомки, то… може бути легше показати вам, ніж описати її. Дозволяючи ІІ аналізувати різні зображення для вмісту, вони дали цікаві результати. Нижче наведено слайд-шоу з нашими результатами. Я закинув у додаток різноманітні зображення, щоб проаналізувати те, що він може визначити і що не може.

Собака не * в кошику. Процес ідентифікації, очевидно, має проблеми з глибиною.

Не-собака не покрита снігом.

Давайте, хлопці. На цьому етапі ви даєте кітком комплекс.

Добре, принаймні йому отриманий * види * право цей раз.

Я не впевнений, як описати те, що носить Кім Кардашян, але "костюм і краватку" не те, що я б вибрав. Знову ж таки, програма має проблеми з з'ясуванням, яка інформація про глибину пов'язана з якою особою.

Це додаткові дані, зроблені програмою для попередньої фотографії. Додаток належним чином розпізнає двох осіб, але не згадує і не містить жодних даних про друге. Наскільки це стосується, ця особа не знаходиться на зображенні.

Приклад обробки тексту. Додаток правильно підібрав кожний окремий рядок тексту і прочитав дані належним чином під час запиту.

Ні. Гранати.

Це єдине зображення, яке було правильно ідентифіковано та точно передане.

Не зовсім. Додаток не зміг визнати, що каструля містила бекон, незважаючи на те, що йому було надано кілька версій цього знімка з різних кутів. Іноді визнавалося, що каструля містила їжу і іноді думала, що в ній є інший об'єкт.

Загальна продуктивність просто не дуже хороша. Текстовий аналіз був досить сильним, і програма добре виконує роботу, читаючи матеріал, який він бачить, але все інше - це crapshoot. Бачачи AI не може сказати собакам і кішкам дуже легко. Не можна сказати, чи є на плиті тарілка. Він не може правильно ідентифікувати різні продукти.

Що стосується фотографічного аналізу на основі сенсорного виклику, цієї функції також бракує.

Бачачи AI правильно визначив це як кішку, хоч це помилялося Alisdair для Persian (він є значною мірою Maine Coon). Він навіть наполягав на «читанні» V у своєму хутрі як на фактичному V. (Це витягнуло це трюк на килимі шаблони також у одному пункті, наполягаючи що килим у обідаючому приміщенні було помічене AAAAAAAAAAAA повторення). Додаток описує його як "сплячого перського кота", який не надто поганий. Але цей рівень опису рідкісний. Велику частину часу, що ви отримуєте, це "Людина" і велика синя коробка навколо однієї особи. Програма розповість, скільки об'єктів вона розпізнає, але насправді не показує вам, де знаходяться об'єкти. Ви повинні простежити свій палець по всьому екрану, сподіваючись вдарити будь-який об'єкт, який камера бачила. Тільки один об'єкт за раз виділяється синім кольором (як вище), і він завжди є останнім об'єктом, до якого ви доторкнулися.

Це не має значення для сліпих, які повинні були б вивчити все зображення, незважаючи ні на що, але це дивно, що Microsoft не розуміла, що користувачі з низьким баченням також матимуть вигоду бачити всі поля, де об'єкти були виявлені в даному зображенні відразу, а не полювати за ними окремо через сліпий пошук пальців. Кілька фотографій також повернулися з повідомленням «Не виявлено жодної інформації», без даних про те, чому це було або як ми можемо вирішити проблему.

Загалом, ми додамо програмі "A" для зусиль. Він справді намагається забезпечити нові та цікаві можливості в тій місцевості, де їм дуже потрібні. Фактичне виконання, однак, все ще цілком бракує. Зрозуміло, що ці моделі потребують більшої підготовки, перш ніж хто-небудь може покладатися на них для навігації або ідентифікації об'єкта. Об'єкти не ідентифіковані належним чином, вони не розміщені в належному контексті на фото, а численні питання, які мають глибоке розуміння AI, змушують нас нервувати, якщо ми справді намагаємося використовувати програму для навігації у фізичному світі. Розповідаючи сліпому, що на плиті є плита, коли на тарілці немає такої тарілки, це може бути абсолютно небезпечним. Можливість перегляду фотографій на дотик, хоча й цікава, в кінцевому рахунку не була достатньо точною, щоб забезпечити привабливий випадок використання.

Ми підтримуємо те, що Microsoft намагається зробити тут. Ми співчуваємо з труднощами і сподіваємося, що компанія продовжить. Але, незважаючи на те, що побачити AI може бути корисним для конкретних речей, як, наприклад, правильна ідентифікація валюти (я не зміг перевірити цей аспект, не маючи жодної готівки на даний момент), він не здивував нас своєю здатністю інтерпретувати світ пробудження.

Модульні інвалідні інвалідні коляски можуть спостерігати за перешкодами, включати головного відстеження Новий адаптивний контролер Microsoft для геймерів з обмеженою мобільністюКитайські дослідники використовують Kinect для перекладу мови жестів до тексту

Читати далі

Minecraft з відстеженням променів тепер доступний для всіх програвачів Windows 10

Зазвичай ви не думаєте про Minecraft як про реалістичну гру, але розробники наполегливо працюють над додаванням трасування RTX променів до гри протягом останніх восьми місяців. Сьогодні він нарешті вийшов з бета-версії, і це дійсно працює з блоковим виглядом Minecraft.

Quake II RTX тепер працює на графічних процесорах AMD завдяки технології відстеження променів Vulkan

Nvidia Quake II RTX тепер працює на графічних процесорах AMD за допомогою Vulkan, якщо у вас є правильний драйвер (і RX 6000).

Stadia тепер відтворюється на iPhone завдяки новому веб-додатку Google

Google пообіцяв підтримку iPhone, але політика Apple App Store завадила. Тепер нарешті є спосіб відтворити Stadia на iOS - просто запустіть Safari і перейдіть на сайт Stadia, щоб використовувати нову прогресивну веб-програму.

НАСА відмовляється від теплового зонда "Марс", що проростає "InSight"

Посадочний апарат NASA InSight вже більше двох років вивчає червону планету. За цей час InSIght передала дані про сейсмічну активність планети, погоду та навіть звук вітру, що дме. Також передбачалося передавати дані про внутрішню температуру планети, але NASA оголосило, що відмовляється від цієї спроби після того, як не змогло змусити тепловий зонд закопатися у дрібну марсіанську землю.