Авторитетное издание The Economist в мае 2017 года объявило, что самый ценный мировой ресурс изменился: это уже не нефть, а данные. В последние годы активно развиваются инструменты для добычи и обработки этого ресурса. Они называются «Большие данные» и обещают невероятные возможности компаниям, их клиентам и обычным людям.
Под словосочетанием «Большие данные» (Big Data) понимают способы, инструменты и методы обработки огромных массивов информации. На первый взгляд такие данные выглядят информационным хаосом, однако после обработки из них можно получить прогнозы, тенденции и т. п. Особую популярность средства Big Data стали набирать в 2010-х годах, когда стали популярными ноутбуки, смартфоны, планшеты и другие электронные гаджеты, являющиеся источником разнообразной информации.
Польза Big Data на практике
«Большие данные» уже доказали свои мощные возможности для повышения производительности, экономии ресурсов и увеличения комфорта в различных отраслях – здравоохранении, производстве, сфере услуг, транспорте, страховании и тому подобное. Вот несколько примеров их практического использования.
Доктор Джон Халамка, который работал директором по информации многих медучреждений, включая Гарвардскую медицинскую школу, смог спасти благодаря «Большим данным» свою жену-азиатку. У нее в 2011 году обнаружили последнюю стадию рака молочных желез. Халамка с командой собрал со всех гарвардских госпиталей информацию о лечении 10 тысяч азиаток с такой же болезнью. Доктору удалось найти лекарства, которые были наиболее эффективными для его жены. Халамка считает, что именно такая находка на основе анализа информации помогла женщине полностью выздороветь.
В Непале в апреле 2015 года произошло разрушительное землетрясение, которое убило почти 9000 человек и ранило 22 тысячи. После катастрофы нужно было как можно быстрее помочь пострадавшим. Компания SAS из Северной Каролины проанализировала данные размещения людей, которые предоставила Международная организация по миграции, и смогла организовать лучшее распределение имеющихся ресурсов. Проанализировав данные Торговой палаты ООН, в SAS также подсказали лучших экспортеров на поставку материалов для восстановления страны.
Немецкий авиаперевозчик Lufthansa благодаря Big Data теперь точно знает, что именно и когда сломается в каком-то из его самолетов. Это позволяет компании проводить заблаговременный ремонт, не ожидая появления реальной поломки, что увеличивает время простоя. Источником информации стали разнообразные подключенные к интернету датчики (так называемый интернет вещей). Эти сенсоры непрерывно считывают показатели узлов самолета и отправляют их в центр обработки. Имея такую информацию, системы машинного обучения предусматривают, когда та или иная деталь может выйти из строя.
В США в 2014 году произошла эпидемия заражения опасной бактерией сальмонеллой. Найти источник не удавалось, пока агентство по вопросам пищи и лекарств Food and Drug Administration (FDA) не привлекло «Большие данные». Информацию собирал центр по контролю и предотвращению болезней (CDC), база данных которого насчитывает более 17 терабайтов данных о геноме различных организмов от 51 тысячи объектов. Ежемесячно эта база GenomeTrakr пополняется информацией от 1 тысячи новых объектов. Проанализировав имеющиеся сведения, специалисты нашли источник – завод по производству орехового масла. Фабрику остановили, а эпидемию удалось преодолеть.