AI-агенти, що вміють самостійно ходити в інтернет, клікати кнопки, логінитися на сайтах і збирати дані, вже перестали бути фантастикою. Але будь-хто, хто намагався під’єднати модель до браузера, знає інший бік цієї історії: блокування, CAPTCHA, бан IP, крихкі скрипти на Playwright чи Selenium і повна відсутність масштабованості.
![]()
У новому туторіалі на каналі Tech With Tim розбирають Browserbase — платформу віддалених браузерів для AI-агентів і веб-автоматизації. Окремий пласт екосистеми Browserbase — це те, що робить агентів не просто «розумними», а надійними в реальному вебі: Agent Identity, автоматична робота з CAPTCHA та інтеграція через MCP із середовищами на кшталт Claude Code.
Ця стаття зосереджується саме на цих трьох речах: як Browserbase домовляється з Cloudflare та CAPTCHA-провайдерами, як дає агентам можливість проходити захист без ручного втручання і як підключається до сучасних AI-IDE через MCP, щоб агенти могли керувати браузером як стандартним інструментом.
Agent Identity: коли бот офіційно визнається агентом
Класичний підхід до веб-скрапінгу та автоматизації виглядає приблизно однаково: розробник піднімає локальний або серверний Chrome, підключає Playwright чи Selenium, пише скрипти, які клікають по CSS-селекторах, і сподівається, що сайт не змінить верстку завтра. Паралельно доводиться боротися з Cloudflare, rate limit, CAPTCHA та IP-блокуваннями.
Browserbase підходить до проблеми інакше. Замість того, щоб намагатися маскуватися під «людину» і обходити захист, платформа вводить концепцію Agent Identity — ідентичності AI-агента, яка офіційно визнається сайтами через партнерства з Cloudflare та низкою CAPTCHA-вендорів.
Суть у тому, що Browserbase не займається обфускацією чи «антидетектом». Навпаки, платформа виступає як посередник, який може сказати інфраструктурі захисту: це автоматизований агент, але він авторизований, працює в рамках правил і має право бачити сторінку. У відповідь системи на кшталт Cloudflare та інтегровані CAPTCHA-провайдери пропускають сесію без агресивних блокувань.
Для розробника це означає, що віддалені браузерні сесії Browserbase значно рідше стикаються з:
- блокуваннями доступу до сторінок;
- банами IP-адрес;
- жорсткими rate limit;
- нескінченними CAPTCHA.
Фактично Agent Identity перетворює AI-агента з «підозрілого бота» на «відомого клієнта» для інфраструктури захисту. Це критично для довготривалих сценаріїв: якщо агент має, наприклад, кілька годин крок за кроком виконувати складний бізнес-процес у вебі, випадковий бан посередині руйнує всю логіку. Agent Identity зменшує ймовірність такого зриву.
Особливо помітна різниця між запуском десятків автоматизованих вкладок локально і роботою через Browserbase. Якщо на домашній машині спробувати одночасно автоматизувати 20 вкладок Chrome, захист багатьох сайтів сприйме це як підозрілу активність і швидко заблокує. У Browserbase ті ж самі сценарії виконуються через інфраструктуру, яка вже «познайомлена» з провайдерами захисту, тож масштабування до багатьох сесій не виглядає для сайтів як атака.
CAPTCHA без людей: як Stagehand тримає потік живим
Навіть із Agent Identity повністю позбутися CAPTCHA неможливо: частина сайтів використовує їх як базовий елемент безпеки. Для класичних скриптів це означає зупинку процесу, очікування на людину або інтеграцію з окремими сервісами розв’язання CAPTCHA.
У Browserbase цю проблему вбудовано в загальну логіку керування браузером. Платформа пропонує SDK Stagehand, який дає змогу керувати браузером через природну мову й AI-моделі, а не через жорстко прописані селектори. І в цьому ж шарі логіки з’являється автоматичне очікування розв’язання CAPTCHA.
Якщо конфігурація агента налаштована відповідним чином, Stagehand може:
- виявити, що на сторінці з’явилася CAPTCHA;
- поставити виконання сценарію «на паузу»;
- дочекатися, поки CAPTCHA буде вирішена через інтегровані механізми;
- продовжити виконання потоку без участі людини.
З точки зору розробника це виглядає як безперервний сценарій: агент переходить на сторінку, стикається з CAPTCHA, «переживає» її і рухається далі. Немає потреби вставляти в код ручні гачки, чекати на оператора чи інтегрувати сторонні сервіси розв’язання.
У поєднанні з Agent Identity це дає важливий ефект: CAPTCHA стає не фатальною перешкодою, а ще одним елементом середовища, з яким агент уміє працювати. Для довгих ланцюжків дій — наприклад, автоматизованого онбордингу на сервісах, складних форм, багатокрокових пошуків — це різко підвищує надійність. Потік не обривається через те, що десь посередині з’явилося вікно з перевіркою.
MCP як стандартний міст: як Claude Code отримує доступ до Browserbase
Ще одна проблема, з якою стикаються розробники агентів, — це підключення зовнішніх інструментів до різних AI-оточень. Кожне середовище має свої протоколи, формати і плагінні системи. Щоб браузер став «рідним» інструментом для агента, потрібен стандартизований спосіб інтеграції.
Browserbase вирішує це через MCP (Model Context Protocol) — стандарт, який дозволяє AI-оточенням підключати зовнішні інструменти як сервери MCP. Платформа надає готову MCP-конфігурацію, яку можна додати, зокрема, до Claude Code.
Сценарій виглядає так. Користувач створює безкоштовний акаунт у Browserbase, заходить у дашборд і отримує свій API-ключ у відповідному розділі. Цей ключ — єдиний обліковий маркер, який потрібен для аутентифікації як MCP-сервера, так і SDK.
Далі в Claude Code у конфігурацію MCP-серверів додається запис для Browserbase. Це можна зробити вручну, але в демонстрації використовується більш зручний шлях: конфігурація копіюється з документації Browserbase, вставляється в Claude Code, а сам Claude допомагає додати її до списку MCP-серверів. Потім у відповідне поле підставляється API-ключ.
Після перезапуску Claude Code у списку MCP-інструментів з’являється Browserbase. Усередині — набір доступних «тулів», які дозволяють:
- створювати віддалені браузерні сесії;
- переходити на сайти;
- взаємодіяти зі сторінками;
- витягувати з них інформацію.
Усе це — без необхідності піднімати локальний браузер на машині, де запущений Claude Code. Агент у Claude просто викликає інструмент MCP, а той, у свою чергу, звертається до Browserbase.
У демонстрації агенту дають завдання: через Browserbase піти на YouTube, знайти канал Tech With Tim і визначити останнє опубліковане відео. Claude Code, використовуючи MCP-сервер Browserbase, запускає віддалений браузер, переходить на YouTube, виконує пошук, скролить сторінку, аналізує результати і повертає відповідь із назвою, кількістю переглядів і часом публікації.
Ключовий момент у тому, що для розробника це виглядає як звичайний виклик інструмента в AI-сесії. Уся складність — створення сесії, робота з браузером, взаємодія з сайтом, Agent Identity, CAPTCHA — захована за MCP-сервером Browserbase.
Browser API під капотом MCP: як агенти реально керують браузером
MCP-конфігурація — це лише «фасад». Під капотом Browserbase надає Browser API, який дозволяє програмно створювати та керувати віддаленими браузерними сесіями. Саме цей API викликають MCP-сервери й кастомні агенти.
Коли агент через Claude Code або інше середовище просить «піти на YouTube і знайти останнє відео», відбувається низка технічних кроків:
спочатку MCP-сервер Browserbase, аутентифікований через API-ключ користувача, звертається до Browser API і створює нову віддалену сесію браузера. Ця сесія — повноцінний «живий» браузер у хмарі, який виглядає для сайтів як реальний користувач.
Далі в цю сесію підключається AI-шар керування, зокрема Stagehand, який інтерпретує високорівневі інструкції агента. Замість того, щоб клікати по жорстко заданих селекторах, Stagehand працює з діями на кшталт «перейти на YouTube», «знайти канал Tech With Tim», «визначити останнє відео». Модель сама вирішує, які елементи сторінки потрібно натиснути, які поля заповнити, що прочитати.
Паралельно Browserbase записує все, що відбувається в сесії. У дашборді можна в реальному часі спостерігати, як агент скролить сторінку, вводить запити, переходить за посиланнями. Після завершення сесії залишається повний запис відтворення — своєрідний «реплей» усіх дій, а також список відвіданих сторінок.
Окремо зберігаються мережеві логи: усі HTTP-запити, які робив браузер під час сесії. Це важливий інструмент для налагодження: якщо агент не зміг дістатися потрібної інформації, можна подивитися, які запити були відхилені, де спрацювали редиректи, чи не виникли помилки на стороні сайту.
Усе це доступно не лише через MCP. Ті самі можливості можна використовувати безпосередньо з коду — наприклад, у Python-скриптах, які запускаються на VPS без графічного інтерфейсу. У такому випадку розробник працює безпосередньо з Browser API або SDK, але під капотом все одно створюються ті ж самі віддалені сесії з Agent Identity, автоматичною обробкою CAPTCHA та записом усіх дій.
Від локальних експериментів до масштабованих агентів
Поєднання Agent Identity, автоматичної роботи з CAPTCHA та MCP-інтеграції змінює те, як виглядає життєвий цикл AI-агента, що працює з вебом.
На локальній машині типовий сценарій виглядає так: розробник запускає агент у середовищі на кшталт Claude Code, підключає локальний браузер, пробує кілька простих задач — і на цьому все. Масштабувати це на десятки сесій, перенести на VPS чи у продакшн важко: немає браузера, немає графічного інтерфейсу, є ризик блокувань, а підтримка скриптів стає болючою.
У випадку з Browserbase архітектура інша. Агент працює в будь-якому середовищі — локально, у хмарі, на VPS — і сприймає браузер як віддалений сервіс. Через MCP він отримує стандартний набір інструментів для роботи з вебом. Під капотом Browser API створює сесії, які вже «знайомі» з інфраструктурою захисту через Agent Identity, а Stagehand і пов’язані механізми вміють переживати CAPTCHA без участі людини.
У результаті AI-агенти стають не просто «розумними чатами», а надійними виконавцями довгих, крихких веб-процесів. Вони можуть працювати годинами, переходячи з сайту на сайт, авторизуючись, заповнюючи форми, витягуючи дані — і при цьому значно рідше зупиняються через блокування чи CAPTCHA.
Для розробників це відкриває можливість будувати сервіси, які раніше були надто крихкими або дорогими в підтримці: від складних систем моніторингу й аналітики до бізнес-процесів, де людина сьогодні просто «клацає по браузеру» годинами. Тепер ту саму роботу можна делегувати агенту, який має офіційний статус у систем захисту й уміє самостійно проходити перевірки.
Висновок: надійність як ключова риса нового покоління AI-агентів
Багато розмов про AI-агентів зосереджуються на «розумі» моделей: наскільки добре вони розуміють інструкції, планують дії, пишуть код. Але в реальному вебі не менш важлива інша характеристика — надійність. Чи зможе агент виконати задачу від початку до кінця, не зламавшись об CAPTCHA, Cloudflare чи випадкову зміну верстки?
Екосистема Browserbase пропонує відповідь саме на це запитання. Agent Identity зменшує кількість блокувань і банів, автоматична обробка CAPTCHA в Stagehand дозволяє потокам продовжуватися без участі людини, а MCP-інтеграція робить віддалений браузер стандартним інструментом у середовищах на кшталт Claude Code. Під капотом усе це працює через Browser API, який створює й керує віддаленими сесіями, доступними як для агентів, так і для кастомних скриптів.
У підсумку AI-агенти отримують не просто доступ до браузера, а інфраструктуру, яка дозволяє їм поводитися як «легальні» користувачі, здатні стабільно виконувати складні сценарії в реальному, захищеному вебі.
Джерело
AI Web Scraping Is Insanely Good | Browserbase Full Tutorial


