Четвер, 21 Листопада, 2024

Як вампіри із «Сутінок» на десятиліття зруйнували пошук картинок Google

Сервіс Google Картинки – потужний інструмент для пошуку потрібного зображення на майже безмежних просторах інтернету. Його алгоритми здатні навіть знаходити зображення за зображенням. Однак інтелектуальні алгоритми Google Картинок назавжди зруйнував тимчасовий сплеск популярності підліткової драми про кохання вампірів.

Не вірите? Давайте разом проведемо експеримент. Відкрийте свій улюблений браузер у режимі інкогніто – для максимальної об’єктивності. Перейдіть у пошук Google Картинки, і давайте пройдемося за часами доби.

Google Картинки видає чудові результати для пошукового запиту «світанок»:

Не менш красиві зображення знаходяться для пошуку за словом «день»:

Але щойно ви захочете подивитися на прекрасні фотографії сутінок, як Google Картинки покажуть вам вампірів:

Майже людяний алгоритм

Помилку в роботі пошукового алгоритму Google (деталі якого тримаються в секреті) можна було б зрозуміти, якби не людський фактор.

Щоб надати результат, пошуковий алгоритм враховує низку факторів: пошукові слова, релевантність та зручність вебсторінок, рівень експертності джерел, координати та налаштування користувача. Кожен із цих факторів має свій коефіцієнт впливу. Наприклад, свіжий контент отримає кращу позицію, ніж старий контент на ту ж тему.

Підписуйтесь на наш канал у Telegramhttps://t.me/techtodayua

У прогнозованість алгоритму додається людський фактор. На Google працюють сторонні підрядники, які вручну оцінюють результати різних пошуків. Вони виносять вердикт, чи відповідає пошуковий результат заданому пошуковому запису.

Google називає таких підрядників «рейтингарями пошукової якості», і вони керуються в роботі набором правил. Останні є публічно доступними, на відміну від деталей роботи алгоритмів. Цей набір правил є книгою на 168 сторінок і є досить складним.

Наприклад, що таке «свіжий»? Поняття «свіжий» у Google ввели приблизно у 2011 році. Воно означає «нещодавні події та «гарячі» теми».

Фільм «Сутінки» з’явився у 2008 році, а у 2009 році вийшов другий фільм серії. У 2020 році ці фільми беззаперечно не відносяться до поняття «свіжий». Також їх не можна віднести до «гарячої» теми, адже піковий інтерес був до перших фільмів, після чого він падав і нині коливається на одиницях відсотків. Але вказівки рейтингарів змушують алгоритми Google коригувати видачу до сьогодні.

Чому все ще вампіри замість часу доби?

Сьогодні дуже мало людей шукають зображення із пошуковим словом «сутінки». Але через те, що не було пікового сплеску до сутінок як оптичного явища, зате був сплеск інтересу до сутінок як серії фільмів, Google досі вважає, що вигаданий Стефані Маєр світ вампірів є найточнішим результатом пошукового запиту «сутінки».

Цікаво, що третій фільм саги «Сутінки», а саме «Сутінки. Сага. Затемнення» 2010 року був значно популярнішим за перші два. Своїм творцям він приніс майже вдвічі більше грошей, ніж перший фільм.

Але якщо в Google Картинках шукати «затемнення», у відповідь ви отримаєте реальні фотографії астрономічного явища «Затемнення». Це тому, що пік пошуків за фільмом «Затемнення» у 2010 році змінив великий пік 2017 року, коли відбулося повне сонячне затемнення.

Те ж саме справедливо і для другого фільму «Сутінки. Сага. Новий місяць» – сплеск інтересу до стрічки з часом замінили сплески інтересу людей, які цікавляться новим місяцем як астрономічним явищем.

Оптичному явищу «сутінки» не пощастило – хоча воно відбувається двічі на день із року в рік, ним цікавляться мало людей. І Google продовжує вважати однойменний фільм 12-річної давнини про вампірів більш відповідною видачею на пошукове слово «сутінки».

Алгоритми Google роблять пошук маріонеткою

Присвоєння більшої значимості популярним матеріалам у минулому робило Google Картинки маріонеткою в політичних іграх.

У 2018 році англомовні користувачі помітили, що при введенні слова «ідіот» пошуковик Google показував їм фотографії президента США Дональда Трампа. Таким чином протестувальники демонстрували невдоволення політиком та його рішеннями.

Для створення такої асоціації в алгоритмах Google невдоволені використовують загальновідому особливість роботи пошуковиків: орієнтацію на популярні матеріали. Активісти публікують статті на своїх власних платформах, в яких асоціюють слово «ідіот» з кимось. Далі вони намагаються всіляко поширити та популяризувати ці матеріали. Завдяки масовості таких статей та великій кількості переходів на них алгоритми Google вважають ці матеріали дуже популярними і затребуваними.

У 2009 році користувачі помітили, що пошуковик на запит «Мішель Обама», яка є чорношкірою жінкою і дружиною колишнього президента США Барака Обами, показував фотографію мавпи із сережками у вухах. Тоді представники Google сказали наступне: «Іноді пошукові результати Google можуть містити неприйнятний контент, навіть від невинних запитів. Ми запевняємо, що погляди, які мають такі сайти, не підтримуються в Google. Пошукові двигуни є відображенням контенту та інформації, які наявні в інтернеті».

За матеріалами: medium.coom

Євген
Євген
Євген пише для TechToday з 2012 року. Інженер за освітою. Захоплюється реставрацією старих автомобілів.

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися