Microsoft выпустила на Android приложение Seeing AI для слабовидящих и слепых пользователей. Это приложение помогает людям «видеть» окружающий мир, описывая все, что попадает в камеру смартфона. Учитывая, что во всем мире более 3 миллиардов пользователей Android, приложение может помочь улучшить качество жизни многих людей.
Цель бесплатного приложения — помочь слепым и слабовидящим людям понять больше об окружающем мире с помощью камер смартфонов и дикторского текста на основе искусственного интеллекта.
Microsoft говорит, что приложение для Android использует последние достижения компании в области генеративного искусственного интеллекта и имеет те же функции, что и версия iOS.
Последние функции Seeing AI были созданы с помощью отзывов пользователей. Microsoft говорит, что приложение теперь предлагает более подробные описания изображений.
По умолчанию Seeing AI представит краткое описание того, что изображено на фотографии. Когда пользователь нажимает значок «дополнительная информация», приложение создаст гораздо более подробное описание изображения. Проведя пальцем по экрану, программа сообщит о расположении различных объектов. Можно также импортировать фотографии из других приложений.
Другой функцией, которую Microsoft недавно ввела после отзывов пользователей, является возможность задавать вопросы документа. После сканирования документа можно задать Seeing AI вопрос о таких вещах, как пункты меню или стоимость товара на счете.
Также можно попросить приложение подытожить статью, отсканированную камерой смартфона.Приложение предоставляет пользователю аудиоинструкции по сканированию печатной страницы.
Seeing AI предлагает пользователям много других способов узнать об окружающем мире, приведя камеру или сфотографировав что-то. К примеру, программа зачитывает короткий фрагмент текста, как только его захватит камера.
Seeing AI может сканировать штрих-коды и предоставлять информацию о продукте, например название и детали из упаковки, если они доступны, что может быть особенно полезным когда речь идет о лекарствах.
Кроме того, приложение может помочь идентифицировать людей и выражения лица, валюту, цвета и яркость. Он также может читать рукописный текст на некоторых языках.
Программа в скором времени появится в Google Play и будет доступна на 18 языках, а в 2024 году их количество должно возрасти до 36 языков.