Потенціал «великих даних» – гігантських масивів неструктурованої інформації – експерти прогнозують дуже великим. З такими відомостями можна передбачати результати виборів, малювати карти поширення вірусних інфекцій та допомагати поліції розплутувати злочини. Однак найбільшою можливістю «великих даних» може бути служба історикам, які з їхньою допомогою зможуть не лише описувати минуле, але й відкрити шаблони розвитку та передбачити, куди рухається світ.
Саме цим займається науковець з Університету Джорджтауна Калев Літару. Він використовує інструмент Google Big Query, створений для обробки великих масивів даних. Наприклад, такого, як база даних GDELT, у якій містяться події починаючи з 1979 року – об’єкт дослідження вченого.
До цього архіву потрапили відомості з великої кількості джерел на понад 100 мовах за останні 35 років. «Що ми зробили, – пояснуює Літару, – так це використали інструмент Google для аналізу чверті мільярда записів. За декілька хвилин ми змогли отримати шаблони в цих даних».
Під шаблонами науковець має на увазі події, що регулярно повторюються. Він також аналізував останні події в Єгипті, Україні та Лівії, щоб знайти такі шаблони.
«Якщо ви візьмете останні два місяці подій в Єгипті та пошукаєте максимально схожі історичні періоди в інших країнах, – розповідає він, – тоді ви зможете дізнатись, що прийде після сучасних подій. У вас з’явиться гарне уявлення про майбутнє».
Перші експерименти
Як приклад учений проаналізував події в Німеччині та Єгипті і знайшов багато схожого. Для обробки він брав часовий інтервал у два місяці, причому для Єгипту це були два місяці перед революцією. Схожість графіків означає те, що задані науковцем параметри соціуму в цих країнах збігалися в заданий період часу.
Схожість ліній показує схожість подій в Німеччині 2009 року та Єгипті за два місяці до початку революції в 2011 році. Окрім цього, схожі і події, які відбулися після максимального піку соціального напруження.
Ще одним експериментальним дослідженням стала Україна. «Довгий час ЗМІ мають малий інтерес до цієї країни, – коментує він отримані графіки. – Проте потім видно складні піки впродовж двох місяців після початку протестів. Виявляється, що це передбачає весь цикл подій».
Цей графік показує схожість подій в Україні з центром 22 лютого 2014 року, коли президент Віктор Янукович залишив державу. Пошук BingQuery знайшов в історії 32626 таких самих періодів в інших країнах світу. А найближчою виявилась Туреччина наприкінці 1998 року.
Технології для істориків
Тобто якщо проаналізувати доступні в ЗМІ масиви інформації за певний період часу, тоді можна отримати першу чернетку історії. А якщо знайти країну, в якій відбувалися максимально схожі події, тоді можна побачити приблизний розвиток майбутнього.
Літару каже, що історики повинні брати на озброєння сучасні технології і бачити в них своїх союзників, а не ворогів. «Великі дані» та автоматизовані засоби їхньої обробки, за словами вченого, дозволяють швидко бачити тенденції в суспільстві та прогнозувати їхній розвиток.
За матеріалами: BBC