Вторник, 8 октября, 2024

Как вампиры из «Сумерек» на десятилетие разрушили поиск картинок Google

Сервис Google Картинки – мощный инструмент для поиска нужного изображения на почти безграничных просторах интернета. Его алгоритмы способны даже находить изображения по изображению. Однако интеллектуальные алгоритмы Google Картинок навсегда разрушил временный всплеск популярности подростковой драмы о любви вампиров.

Не верите? Давайте вместе проведем эксперимент. Откройте свой любимый браузер в режиме инкогнито – для максимальной объективности. Перейдите в поиск Google Картинки, и давайте пройдемся по временам суток.

Google Картинки выдает прекрасные результаты для поискового запроса «рассвет»:

Не менее красивые изображения находятся для поиска по слову «день»:

Но как только вы захотите посмотреть на прекрасные фотографии сумерек, как Google Картинки покажут вам вампиров:

Почти человеческий алгоритм

Ошибки в работе поискового алгоритма Google (детали которого держатся в секрете) можно было бы понять, если бы не человеческий фактор.

Чтобы предоставить результат поисковый алгоритм учитывает ряд факторов: поисковые слова, релевантность и удобство веб-страниц, уровень экспертности источников, координаты и настройки пользователя. Каждый из этих факторов имеет свой коэффициент влияния. Например, свежий контент получит лучшую позицию, чем старый контент на ту же тему.

Підписуйтесь на наш канал у Telegramhttps://t.me/techtodayua

В прогнозируемость алгоритма добавляется человеческий фактор. На Google работают сторонние подрядчики, которые вручную оценивают результаты различных поисков. Они выносят вердикт, соответствует ли поисковый результат заданной поисковой записи.

Google называет таких подрядчиков «рейтингерами поискового качества», и они руководствуются в работе набором правил. Последние являются публично доступными, в отличие от деталей работы алгоритмов. Этот набор правил является книгой на 168 страниц и является достаточно сложным.

Например, что такое «свежий»? Понятие «свежий» в Google ввели примерно в 2011 году. Оно означает «недавние события и «горячие» темы».

Фильм «Сумерки» появился в 2008 году, а в 2009 году вышел второй фильм серии. В 2020 году эти фильмы безусловно не относятся к понятию «свежий». Также их нельзя отнести к «горячей» теме, ведь пиковый интерес был к первым фильмам, после чего он падал и сейчас колеблется на единицах процентов. Но указания «рейтингеров» заставляют алгоритмы Google корректировать выдачу до сих пор.

Почему все еще вампиры вместо времени суток?

Сегодня очень мало людей ищут изображения с поисковым словом «сумерки». Но из-за того, что не было пикового всплеска к сумеркам как оптическому явления, зато был всплеск интереса к сумеркам как серии фильмов, Google до сих пор считает, что придуманный Стефани Майер мир вампиров является наиболее точным результатом поискового запроса «сумерки».

Интересно, что третий фильм саги «Сумерки», а именно «Сумерки. Сага. Затмение» 2010 года был значительно популярнее первых двух. Своим создателям он принес почти вдвое больше денег за первый фильм.

Но если в Google Картинках искать «затмение», в ответ вы получите реальные фотографии астрономического явления «Затмение». Это потому, что пик поисков по фильму «Затмение» в 2010 году сменил большой пик 2017 года, когда произошло полное солнечное затмение.

То же самое справедливо и для второго фильма «Сумерки. Сага. Новолуние» – всплеск интереса к ленте со временем заменили всплески интереса людей, интересующихся новым месяцем как астрономическим явлением.

Оптическому явлению «сумерки» не повезло – хотя оно происходит дважды в день из года в год, им интересуются мало людей. И Google продолжает считать одноименный фильм 12-летней давности о вампирах более соответствующей выдачей на поисковое слово «сумерки».

Алгоритмы Google делают поиск марионеткой

Присвоение большей значимости популярным материалам в прошлом делало Google Картинки марионеткой в политических играх.

В 2018 году англоязычные пользователи заметили, что при вводе слова «идиот» поисковик Google показывал им фотографии президента США Дональда Трампа. Таким образом протестующие демонстрировали недовольство политиком и его решениями.

Для создания такой ассоциации в алгоритмах Google недовольные используют общеизвестную особенность работы поисковиков: ориентацию на популярные материалы. Активисты публикуют статьи на своих собственных платформах, в которых ассоциируют слово «идиот» с кем-то. Далее они пытаются всячески распространить и популяризировать эти материалы. Благодаря массовости таких статей и большому количеству переходов на них алгоритмы Google считают эти материалы очень популярными и востребованными.

В 2009 году пользователи заметили, что поисковик на запрос «Мишель Обама», которая является чернокожей женщиной и женой бывшего президента США Барака Обамы, показывал фотографию обезьяны с серьгами в ушах. Тогда представители Google сказали следующее: «Иногда поисковые результаты Google могут содержать неприемлемый контент, даже от невинных запросов. Мы уверяем, что взгляды, которые имеют такие сайты, не поддерживаются в Google. Поисковые двигатели являются отображением контента и информации, имеющихся в интернете».

По материалам: medium.coom

Євген
Євген
Евгений пишет для TechToday с 2012 года. По образованию инженер,. Увлекается реставрацией старых автомобилей.

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися