Додаток Microsoft «Див. AI» тепер досліджує фотографії з сенсорним, сподіваюся, не буде забито

Додаток Microsoft «Див. AI» тепер досліджує фотографії з сенсорним, сподіваюся, не буде забито

Корпорація Майкрософт опублікувала значне оновлення для своєї програми з використанням AI для людей з вадами зору. Призначений для сліпих або тих, хто має слабкий зір, Seeing AI має список функціональних можливостей, які, очевидно, мають на меті забезпечити широкий спектр можливостей. Це останнє оновлення нібито додає можливість вивчати вже зроблені фотографії на дотик. AI використовується для аналізу сцени та відображення конкретних об'єктів у фото. Проведіть пальцем по зображенню, і телефон виявить, які об'єкти ви знаходитесь поруч, і ідентифікуйте їх вам.

Якщо ви навіть коли-небудь намагалися використовувати програму для читання з екрана, ви, мабуть, знаєте, наскільки погано технологія відображає сучасний спосіб використання комп'ютерів. Хоча вони працюють досить добре для деяких програм, читачі екрана не дуже легко відображаються в сучасному Інтернеті. Ряд авторів з доступності говорили на цю тему досить добре. Суть полягає в тому, що допоміжні технології могли б абсолютно використовувати імпульс. Я перевірив Побачивши AI, сподіваючись, що це вкаже шлях до кращого майбутнього. Провівши деякий час з нею, я б сказав, що він має справжню обіцянку і деякі проблеми, які змушують рекомендувати як надійного джерела інформації саме зараз. Враховуючи, що вся мета програми полягає в тому, щоб визначити речі, які можуть бути цікавими.

Бачачи, що AI використовує камеру телефону + штучний інтелект, щоб визначити, що він «бачить».

  • Короткий текст
  • Документ
  • Продукт (сканування штрих-кодів)
  • Людина (можна навчити розпізнавати окремих людей)
  • Валюта
  • Сцена
  • Колір
  • Рукописний текст
  • Світло (використовує звукові сигнали, щоб повідомити вам, коли камера вказана на найяскравіше джерело світла, яке він може бачити)

Функція ідентифікації та аналізу фотографій була головною, яку ми хотіли сьогодні протестувати, тому що це додало Microsoft з цим оновленням, але ми також взяли інші функції для обертання. Додаток працює досить добре на виявленні документів і тексту, особливо якщо ви використовуєте білий фон. Ми не змогли правильно визначити штрих-коди продуктів; цей аспект програми завжди не вдалося з повідомленням "Вибачте, щось пішло не так". Коли ми спробували скористатися функцією «Сцена», система зазвичай невірно ідентифікувала меблі, наприклад, помилкове прибирання комода для столу.

Що стосується фотозйомки, то… може бути легше показати вам, ніж описати її. Дозволяючи ІІ аналізувати різні зображення для вмісту, вони дали цікаві результати. Нижче наведено слайд-шоу з нашими результатами. Я закинув у додаток різноманітні зображення, щоб проаналізувати те, що він може визначити і що не може.

Загальна продуктивність просто не дуже хороша. Текстовий аналіз був досить сильним, і програма добре виконує роботу, читаючи матеріал, який він бачить, але все інше - це crapshoot. Бачачи AI не може сказати собакам і кішкам дуже легко. Не можна сказати, чи є на плиті тарілка. Він не може правильно ідентифікувати різні продукти.

Що стосується фотографічного аналізу на основі сенсорного виклику, цієї функції також бракує.

Додаток Microsoft «Див. AI» тепер досліджує фотографії з сенсорним, сподіваюся, не буде забито

Бачачи AI правильно визначив це як кішку, хоч це помилялося Alisdair для Persian (він є значною мірою Maine Coon). Він навіть наполягав на «читанні» V у своєму хутрі як на фактичному V. (Це витягнуло це трюк на килимі шаблони також у одному пункті, наполягаючи що килим у обідаючому приміщенні було помічене AAAAAAAAAAAA повторення). Додаток описує його як "сплячого перського кота", який не надто поганий. Але цей рівень опису рідкісний. Велику частину часу, що ви отримуєте, це "Людина" і велика синя коробка навколо однієї особи. Програма розповість, скільки об'єктів вона розпізнає, але насправді не показує вам, де знаходяться об'єкти. Ви повинні простежити свій палець по всьому екрану, сподіваючись вдарити будь-який об'єкт, який камера бачила. Тільки один об'єкт за раз виділяється синім кольором (як вище), і він завжди є останнім об'єктом, до якого ви доторкнулися.

Це не має значення для сліпих, які повинні були б вивчити все зображення, незважаючи ні на що, але це дивно, що Microsoft не розуміла, що користувачі з низьким баченням також матимуть вигоду бачити всі поля, де об'єкти були виявлені в даному зображенні відразу, а не полювати за ними окремо через сліпий пошук пальців. Кілька фотографій також повернулися з повідомленням «Не виявлено жодної інформації», без даних про те, чому це було або як ми можемо вирішити проблему.

Загалом, ми додамо програмі "A" для зусиль. Він справді намагається забезпечити нові та цікаві можливості в тій місцевості, де їм дуже потрібні. Фактичне виконання, однак, все ще цілком бракує. Зрозуміло, що ці моделі потребують більшої підготовки, перш ніж хто-небудь може покладатися на них для навігації або ідентифікації об'єкта. Об'єкти не ідентифіковані належним чином, вони не розміщені в належному контексті на фото, а численні питання, які мають глибоке розуміння AI, змушують нас нервувати, якщо ми справді намагаємося використовувати програму для навігації у фізичному світі. Розповідаючи сліпому, що на плиті є плита, коли на тарілці немає такої тарілки, це може бути абсолютно небезпечним. Можливість перегляду фотографій на дотик, хоча й цікава, в кінцевому рахунку не була достатньо точною, щоб забезпечити привабливий випадок використання.

Ми підтримуємо те, що Microsoft намагається зробити тут. Ми співчуваємо з труднощами і сподіваємося, що компанія продовжить. Але, незважаючи на те, що побачити AI може бути корисним для конкретних речей, як, наприклад, правильна ідентифікація валюти (я не зміг перевірити цей аспект, не маючи жодної готівки на даний момент), він не здивував нас своєю здатністю інтерпретувати світ пробудження.

Модульні інвалідні інвалідні коляски можуть спостерігати за перешкодами, включати головного відстеження Новий адаптивний контролер Microsoft для геймерів з обмеженою мобільністюКитайські дослідники використовують Kinect для перекладу мови жестів до тексту

Читати далі

Чарівний стрибок запустив, сподіваюся, з парашутом
Чарівний стрибок запустив, сподіваюся, з парашутом

Чарівний стрибок, нарешті, розпочато - якщо ви живете в одному з шести міст, вам належить заощадити кілька тисяч доларів, і не заперечуйте про стрибок на непереконливій, невизначеній технологічній платформі.