Людина проти штучного інтелекту: хто кращий гравець

Команди, які створюють штучний інтелект для ігор, зазвичай тестують алгоритми. Ці алгоритми знадобляться для вирішення серйозніших завдань

11 травня 1997 року комп’ютер Deep Blue переміг чемпіона світу з шахів Гаррі Каспарова із загальним рахунком 3,5 на 2,5 бали. Дві партії виграв комп’ютер, один раз людина, а три партії було зіграно внічию. Ця подія викликала справжній фурор. Сьогодні спеціалізовані комп’ютери та програми теж змагаються з людьми в різноманітних іграх. І зазвичай перемагають. Ми розповімо, чому так відбувається, а також розповімо про найвідоміші протистояння людини та штучного інтелекту.

Від шахів до кіберспорту

Комп’ютер Deep Blue компанії IBM, який обіграв Каспарова, не був звичайним суперкомп’ютером. Його проектували спеціально для вирішення шахових задач. Він мав 480 спеціалізованих шахових процесорів і 30 багатозадачних.

Кожен шаховий процесор працював на мізерній за сучасними мірками частоті – 24 МГц. Але при цьому обробляв за секунду від 2 до 2,5 млн шахових позицій, а загалом комп’ютер міг прораховувати до 200 млн позицій на секунду.

Проте навіть така потужність не дозволила машині виграти всі партії, з яких складався поєдинок. До того ж перший двобій з Deep Blue виграв саме Каспаров, а від третього відмовилася IBM. Це дозволило гросмейстерові та журналістам звинуватити комп’ютерників у не зовсім чесній грі. Мовляв, між партіями другого матчу вони внесли корективи у шахову програму, яка дозволила Deep Blue підлаштуватись під стиль Каспарова та уникнути його пасток.

У 2007 році спеціалізована програма Chinook обрахувала всі можливі комбінації шашок – це, на хвилинку, 500 мільярдів мільярдів (саме так, «мільярдів мільярдів») позицій. Тобто найкращий гравець світу міг максимум звести гру внічию.

У травні 2017 року сталася ще одна знаменна подія – штучний інтелект переміг Ке Дзе, чемпіона світу зі стратегічної гри ґо. Учасники цієї гри кладуть на ігрове поле чорні й білі «камені», щоб відгородити своїм кольором більшу територію ніж суперник.
Ґо набагато більш варіативна, ніж шахи. У ній значно більша кількість можливих ходів, а ігрове поле може мати різні розміри (за домовленістю гравців). Новачки, наприклад, можуть грати на полі 7 на 7, а профі – 19 на 19.

Перемогла чемпіона світу програма AlphaGo, яку розробили в компанії DeepMind. Вона базувалася на штучній нейронній мережі та використовувала два навчальних алгоритми. Спочатку AlphaGo вивчала гру, аналізуючи зіграні людьми партії. Коли основи ґо стали зрозумілі програмі, вона почала грати сама із собою. Таке навчання тривало три роки, що зрештою дозволило програмі стати найкращим гравцем у світі.

Є й багато інших прикладів. У 2008 році покерний бот Polaris, розроблений командою з Університету Альберти, переміг чемпіона світу з техаського холдему (найпопулярніший різновид покеру) та ще одного професійного гравця в грі один на один.

А спеціалісти з Університету Карнегі-Меллон розробили програму Libratus, яка на початку 2017 року перемогла в грі один на один чотирьох професіоналів. Бот Libratus теж використовує у роботі нейронні мережі та навчався покеру, граючи сам із собою, і зрештою навчився навіть блефувати так, що професіонали зазвичай не розгадували його намірів.

На початку серпня 2017 бот OpenAI переміг найкращих кіберспортсменів з дисципліни Dota 2. Цей випадок став першим, коли штучний інтелект переміг професійних кіберспортсменів у їхніх дисциплінах взагалі.

Хто сильніший – людина чи комп’ютер?

Тож чи можна сказати, що штучний інтелект перевершив людину у більшості популярних ігор? Певно, що ні. У кожному з описаних випадків з людиною грав спеціально розроблений для цього інструмент і зазвичай були особливі умови. Так, розробники AlphaGo кажуть, що в разі зміни розмірів поля програма відразу пасує, бо вчилася грати лише на розмірі 19 на 19, тоді як людина спокійно гратиме на будь-якому полі, хоч 40 на 40.

Покерні боти, які виносять чемпіонів у грі один на один, проваляться в грі з дев’ятьма п’яними любителями в піцерії. А бот, який переміг у Dota 2, грав один на один (зазвичай грають п’ять на п’ять) та, скоріше за все, мав доступ до інформації, якої не мала людина (тобто, просто чітерив). Водночас будь-який серйозний гравець у, наприклад, StarCraft 2 легко перемагає найкращих ботів для цієї гри.

Тобто штучний інтелект, який використовує технології машинного навчання та нейронні мережі, дійсно може перемогти людину, але за дотримання чітких правил та умов і після довгої підготовки. Що ж стосується звичайних програм на гаджетах чи в інтернеті, жодна з них не здатна перемогти професійного гравця в ті самі шахи чи ґо.

Також є багато сфер, де штучний інтелект поки що зовсім пасує, – це завдання без фіксованих правил чи з контекстною залежністю. Це, наприклад, розгадування ребусів та інших головоломок. Хоча, наприклад, у царині кросвордів прогрес є — програма Dr.Fill, яка бере участь в американському чемпіонаті з кросвордів, зайняла у 2017 році 11 місце, тоді як у 2013 було 92 місце, а у 2015 – 55-те.

Звісно, якщо великі ІТ-корпорації забажають створити штучний інтелект, який переможе людину в тій чи іншій грі, вони його створять. Питання лише в тому, скільки ресурсів на це потрібно. Навряд чи той самий Google захоче витратити $10 мільярдів на створення бота, який переможе чемпіона зі StarCraft 2 чи займе перше місце в розв’язуванні кросвордів.

Команди, які створюють штучний інтелект для ігор, зазвичай тестують алгоритми. Ці алгоритми знадобляться для вирішення серйозніших завдань. Наприклад, покерний бот грає у гру з обмеженою інформацією. Такі навички можуть зрештою допомогти торгувати на біржі. А команда DeepMind, яка створила AlphaGo, відправила програму у відставку, а сама займається розробкою алгоритмів для пошуку нових матеріалів та розробки ліків. І досвід за AlphaGo допомагає їм у роботі.

Тож можна спати спокійно – якщо ви дійсно у щось добре граєте, смартфон вас не обіграє. Поки що.