Компанії, що працюють з ШІ, перетворилися на ненаситних споживачів даних, адже їхнім моделям потрібні дедалі більші масиви інформації для навчання. Щоб задовольнити цей попит, багато AI‑стартапів ігнорують усталені інтернет‑правила — зокрема robots.txt, який вказує автоматичним краулерам, які частини сайту заборонені для обходу, — та агресивно збирають дані. Це змушує сайти обмежувати доступ до своєї інформації та в окремих випадках укладати ліцензійні угоди з AI‑компаніями. Фітнес‑та соціальна платформа для бігунів Strava рухається в цьому ж напрямку, обмежуючи доступ до свого веб‑сайту та запроваджуючи плату для розробників.

Щоб зупинити скрейпінг, компанія посилює захист навколо сайту й дозволятиме переглядати частину даних лише автентифікованим користувачам. Раніше можна було бачити публічні профілі й списки фітнес‑клубів без входу в обліковий запис. Тепер усі ці дані будуть доступні лише після авторизації, щоб захистити їх від несанкціонованого збору з боку AI‑систем.
Щодо API, раніше розробники могли створювати додатки на базі Strava через безплатну багаторівневу програму доступу: спочатку базовий рівень, а потім — розширення прав у міру зростання додатка. Тепер компанія запроваджує єдину плату у $11,99 на місяць для всіх розробників, при цьому зазначаючи, що ціна може відрізнятися залежно від регіону.
У Strava повідомили, що спільнота розробників зросла з 185 000 минулого року до 241 000 цього року, і компанія планує й надалі її підтримувати. У межах цієї стратегії Strava також планує додати підтримку Model Context Protocol (MCP) — нового стандарту, який дає змогу AI‑асистентам і додаткам доступатися до зовнішніх даних у структурований спосіб, надаючи Strava більше контролю над тим, що саме й як передається.
Компанія також планує закрити частину API‑ендпойнтів — окремих точок доступу, через які сторонні додатки можуть отримувати специфічні дані, наприклад інформацію про клуби, — щоб краще захистити дані користувачів. Strava вже посилювала правила використання API у 2024 році, заборонивши його застосування для навчання AI‑моделей і обмеживши можливість сторонніх додатків відображати дані інших користувачів. Ті зміни викликали невдоволення розробників, які заявляли, що їхні продукти сильно постраждають.
Попри те, що частина розробників може погодитися на абонплату, закриття окремих API‑ендпойнтів усе одно може завдати удару по залежних від них додатках. Strava надає розробникам 90‑денний перехідний період перед набуттям чинності нових правил.
В інтервʼю TechCrunch генеральний директор Strava Майкл Мартін заявив, що неконтрольований AI‑скрейпінг може стати «похоронним дзвоном» для відкритого інтернету.
«AI‑компанії безжально скрейплять публічні веб‑сайти через їхній нескінченний голод до тренувальних даних, що погіршує роботу сайтів загалом, — сказав Мартін. — За останні кілька місяців ми неодноразово стикалися з падінням продуктивності, а в деяких випадках — із помітними перебоями. Окрім скрейпінгу публічних сторінок, вони також намагаються використовувати наш API, ігноруючи його умови, щоб отримати доступ до наших даних».
Він зазначив, що Strava відхилила пропозиції провідних AI‑лабораторій щодо ліцензування даних. Окремо Мартін згадав Perplexity, заявивши, що стартап зі сфери AI‑пошуку спрямовував свій скрейпінг через агрегатори, щоб приховати його походження після того, як дістав відмову. Це узгоджується з попередніми публічними звинуваченнями на адресу Perplexity у подібній поведінці.
Мартін також звернув увагу на перевантаження серверів через «сирі» експериментальні додатки, де виклики до API будуються неефективно й створюють непропорційне навантаження на інфраструктуру Strava. Схожий аргумент використовувала Meta, коли минулого року заборонила сторонні чатботи в WhatsApp, пояснюючи це надмірним системним навантаженням.
Час ухвалення рішень навряд чи випадковий. Strava цього року конфіденційно подала заявку на IPO, і кроки щодо захисту даних, ймовірно, мають продемонструвати майбутнім інвесторам дисципліну в роботі з даними. Порівняння з жорстким обмеженням доступу до API у Reddit у 2024‑му Мартін прокоментував окремо. На відміну від Reddit, який запровадив оплату API‑доступу за кількістю запитів (що зробило його недоступним для багатьох розробників), Strava робить ставку на фіксовану плату, щоб зберегти екосистему розробників.
«Ми хочемо, щоб користувачі відчували, що володіють своїми даними й можуть бути спокійними щодо того, як ми їх контролюємо й захищаємо. Але водночас ми хочемо, щоб розробники й надалі розвивалися та зростали», — підсумував Мартін.


