Если вам хочется сообщить всему миру город, в котором вы живете, тогда достаточно просто оставить несколько твитов в своем аккаунте. Такая технология уже существует, и при этом она использует лишь публично доступные данные. Может показаться, что это малоценная информация, но бизнес готов за нее платить и вкладывать в разработку более точных способов определения местоположения пользователей Twitter.
Сервис микроблогинга оказался мощным инструментом для самых разных целей. С его помощью можно строить и разрушать компании или управлять компьютером пользователя в удаленном режиме. Он легко расскажет тайны личности или покажет распространение вирусных эпидемий. Теперь исследователи из IBM Джахал Махмуд и его коллеги научили Twitter определять географическое расположение пользователя с точностью до города.
Точность словесного поиска
Для того чтобы узнать, откуда поступают те или иные твиты, ученым нужно всего лишь 200 сообщений. Эту подборку они загружают в созданное ими ПО, которое анализирует период самой большой активности пользователя. Это сужает круг городов к одной какой-то часовой зоне. Дальше остается дело техники: названия спортивных команд, культурных мероприятий и прочих уникальных событий, которые юзер часто упоминает вскользь, позволяют с точностью определить населенный пункт, где он живет.
По словам Махмуда, созданная им модель способна распознать город, в котором живет пользователь Twitter, с точностью до 70%. При этом они не используют данные геотагинга – готовые географические координаты, которые может записывать мобильный клиент Twitter. Ведь лишь 3% пользователей этого сервиса держат его активным. Нельзя также надеяться на географическую информацию в профиле юзера. Хотя ее заполняют около 30% пользователей, многие из них указывают фальшивые города.
Кстати, сам Twitter прекрасно осведомлен о месте пребывания своих клиентов: каждый твит отправляется в интернет с географическими координатами. Соцсеть использует эти и другие данные для размещения рекламы в зависимости от географии. Однако сторонним фирмам эта информация оказывается недоступной, и поэтому они разрабатывают собственные способы определения местоположения.
Бизнес хочет знать, где
«Существует настоящая гонка за координатами пользователей Twitter», – говорит партнер Yahoo из Университета Джорджтауна Калев Литару. По его словам, бизнес хочет знать местоположение юзеров для оценки региональных различий в их мышлении и чувствах.
Желание бизнеса знать местоположение пользователей микроблогов настолько велико, что это породило новый сегмент рынка для специализированных компаний. Одна из них – Gnip, которая занимается обработкой данных Twitter и предоставляет географическую и другую информацию. Например, она может подсказать, как часто упоминали название определенного ресторана. А партнерство с картографической компанией Esri помогает наносить эти сведения на карту. Этим в свое время воспользовались спасатели Красного Креста, которые во время урагана Сенди в октябре 2012 года искали пути через завалы по твитам пользователей.
Каждый может воспользоваться данными Gnip, чтобы оценить популярность Android, iPhone или Blackberry в своем городе. Например, в Киеве на Соломенке iPhone пользуется больше человек, чем Android. Первый на карте показан красным цветом, а второй – зеленым. А вот фиолетовым выделен BlackBerry, владельцы которого твитят в основном из центра города, и их практически не видно на фоне гаджетов двух других ОС:
«Есть огромная потребность в географической информации», – отмечает исполнительный директор Gnip Крис Муди.
Разрозненные кусочки несвязанной информации сами по себе несут мало ценности. Но если их объединить, тогда, говорят ученые, они могут открыть посторонним что-то важное или личное. Махмуд советует защищаться от этого при помощи самоцензуры и не упоминать названия заведений, улиц и другой географической информации в своих твитах.
По материалам: Wall Street Journal