Що на фото? Комп’ютери навчилися розповідати

9 Червня 2015

Комп’ютери навчилися робити те, що довгий час було притаманно лише людям. Дослідники Microsoft Research створили алгоритми, які дозволяють машинам описувати зображені на фотографіях об’єкти та пояснювати, що вони роблять. З такою розробкою штучний інтелект, який вміє бачити, чути та розуміти, стає ближчим.

«Машину навчили розуміти зображення так, як це робить людина», – пояснює дослідник центру машинного навчання Microsoft Research Сяодонг Хе (Xiaodong He). Наприклад, коли комп’ютеру показують зображення людини за ПК, його система розпізнавання може зрозуміти, що необхідно зосередитися на людині, а не на ПК. При цьому завдяки наявності бороди та вусів алгоритм зможе сказати, хто на фото: чоловік чи жінка.

Робота над подібними системами розпізнавання ведеться вже кілька десятиліть. Однак довгий час дослідникам не вдавалося вирішити це завдання. Прогрес відбувся в останні кілька років після залучення нейронних мереж – обчислювальних елементів, які працюють за тими ж принципами, що і людський мозок. З такою технологією системам розпізнавання зображень вдалося підвищити свою ефективність та робити менше помилок.

Автоматичне розпізнавання зображень ще далеке від ідеальних результатів, але цей напрям швидко став популярним. Ним займаються експерти з університетів та лабораторій у всьому світі, які намагаються розробити найкращий алгоритм.

Вони регулярно змагаються між собою, і одним з останніх таких конкурсів був MS COCO Captioning Challenge 2015. Створені алгоритми спершу конкурують між собою, а наприкінці їхні результати оцінює комісія журі.

Технології розпізнавання контексту фотографій продовжує розвиватися, і дослідники бачать багато можливостей використання подібних інструментів. Подібні розробки можуть слугувати фундаментом для створення більш розвиненого штучного інтелекту. Наприклад, такого, який зможе бути постійно поряд із користувачем, навчатиметься разом з ним та допомагатиме йому в повсякденних речах.

За матеріалами: Microsoft Daily

Теги
Технології

643

Що на фото? Комп’ютери навчилися розповідати

Facebook та Instagram вбудовують NFT

З’явилися перші скриншоти Google Фото у темній темі

Усі ваші розмови з ChatGPT записані без можливості видалити. Вони стануть доказами в суді

Vodafone повернув зв’язок ще у 14 населених пунктів Київщини та Чернігівщини

Vodafone

Vodafone Україна разом з абонентами допомогли вилікувати 289 дітей

Vodafone Україна тестуватиме перехід на 4G в Ковелі

Віталій Козловський став обличчям нової рекламної кампанії Vodafone

Vodafone інвестував понад 5,3 мільярди гривень в економіку України протягом 3х кварталів 2025

Vodafone прокладе інтернет-кабель через Чорне море

Статті

ChatGPT руйнує шлюби: люди використовують ШІ, щоб атакувати одне одного

Квантовий комп’ютер? Краще взяти комп’ютер 1981 року, абакус і собаку

Чи є рідинне охолодження у смартфонах ефективним? iPhone оснастили рідинним охолодженням, щоб перевірити результат

Як ШІ-моделі генерують відео: зрозуміле пояснення

Огляд OnePlus 15: купуйте, якщо вам набридло заряджати смартфон

Люди потрапляють до психлікарні після спілкування з ШІ

Заряджання 30-80% не зберігає батарейку – результати 2-річного тесту 40 телефонів

ПОРАДИ

Як вимкнути безпечний режим у Windows 11

Як змінити функцію кнопки живлення у Windows 11

Як контролювати артеріальний тиск за допомогою Apple Watch Ultra 2

СТАТТІ

ChatGPT руйнує шлюби: люди використовують ШІ, щоб атакувати одне одного

Квантовий комп’ютер? Краще взяти комп’ютер 1981 року, абакус і собаку

Чи є рідинне охолодження у смартфонах ефективним? iPhone оснастили рідинним охолодженням, щоб перевірити результат

КАТЕГОРІЇ

ПРО НАС

СЛІДКУЙ ЗА НАМИ

Що на фото? Комп’ютери навчилися розповідати

Vodafone

Залишайтеся з нами

Статті

ПОРАДИ

СТАТТІ

КАТЕГОРІЇ

ПРО НАС

СЛІДКУЙ ЗА НАМИ