Claude Code поступово перетворюється з «розумного чат-бота в терміналі» на повноцінне робоче середовище для розробників. У проміжному?до?просунутому гайді на каналі Tech With Tim автор показує свій професійний сетап і пояснює, як налаштувати Claude Code так, щоб він працював швидко, передбачувано й економно. Ключова ідея: не достатньо просто «спілкуватися з моделлю» — потрібно свідомо керувати моделями, контекстом і вартістю сесій.
![]()
Цей матеріал зосереджується саме на оптимізації сесій: як правильно обирати модель (Opus, Sonnet, Haiku), як використовувати службові команди на кшталт /model, /insights, /cost, /context та /compact, і чому контроль контексту стає критично важливим у довгих робочих сесіях.
Чому вибір моделі в Claude Code напряму впливає на гаманець і продуктивність
Claude Code дозволяє перемикатися між моделями за допомогою команди /model. Здавалося б, дрібниця, але саме тут більшість користувачів починають втрачати гроші й продуктивність. У стандартному наборі доступні три моделі: Opus, Sonnet і Haiku, і кожна з них має своє оптимальне застосування.
Opus — це флагманська, найдорожча й найпотужніша модель. Вона краще справляється зі складними завданнями, що вимагають глибокого міркування, багатокрокового планування або роботи з великою кількістю контексту. Але саме через це вона й «з’їдає» кредити найшвидше. Для користувачів на плані Claude за 20 доларів на місяць використання Opus «за замовчуванням» фактично означає постійний ризик дуже швидко вичерпати ліміт. Навіть на максимальному тарифі можна непомітно «спалити» usage за кілька інтенсивних сесій.
Sonnet у цьому трикутнику виступає як збалансований «робочий кінь». Це рекомендована модель за замовчуванням для більшості сценаріїв у Claude Code. Вона достатньо потужна для типових задач розробника: написання та рефакторинг коду, пояснення помилок, генерація тестів, робота з документацією, допомога з архітектурою на рівні невеликих і середніх проєктів. При цьому Sonnet помітно дешевша за Opus, що дозволяє отримати більше корисної роботи в межах того самого ліміту.
Haiku — найекономніша й найлегша модель. Вона не призначена для складних інтелектуальних задач, зате дуже добре підходить для простих або довготривалих операцій, де головне — обсяг, а не «глибина розуміння». Наприклад, масова генерація однотипних даних, нескладні перетворення тексту, довгі, але рутинні завдання, де не хочеться витрачати дорогі токени Opus чи навіть Sonnet. Haiku також доречна, коли потрібно запустити тривалу сесію й не хвилюватися, що вона швидко «з’їсть» увесь usage.
Ключова рекомендація для розробників, які працюють у Claude Code регулярно: свідомо обирати модель під конкретне завдання. Тримати Sonnet як базовий варіант, підключати Opus лише тоді, коли справді потрібен додатковий інтелектуальний «запас міцності», і використовувати Haiku для простих або масових операцій. Перемикання /model — це не косметична опція, а інструмент керування витратами й продуктивністю.
Як /insights перетворює ваш стиль роботи з AI на аналітичний звіт
Ще один маловідомий, але вкрай корисний інструмент у Claude Code — команда /insights. Вона генерує локальний HTML?звіт про те, як саме ви використовуєте Claude Code: які завдання ставите, як формулюєте запити, де модель допомагає ефективно, а де ви витрачаєте ресурси даремно.
Після запуску /insights Claude Code створює локальний файл, який можна відкрити у браузері, наприклад у Chrome. Усередині — не просто «лог сесій», а структурований аналітичний дашборд: графіки, діаграми, текстові пояснення, огляд сильних сторін вашої взаємодії з інструментом і типові помилки. Це свого роду «рев’ю» вашого стилю роботи з AI?асистентом.
Практична цінність такого звіту полягає в тому, що він дозволяє побачити закономірності, які важко помітити під час щоденної рутини. Наприклад, можна виявити, що ви постійно переформульовуєте одні й ті самі запити, замість того щоб один раз створити чітку інструкцію. Або що ви надто часто тримаєте в контексті зайві інструменти й файли, через що зростає вартість сесій і падає швидкість відповіді.
Звіт також показує, де Claude Code працює для вас найкраще. Це може підштовхнути до зміни робочого процесу: більше делегувати моделі ті типи задач, де вона демонструє максимальну ефективність, і, навпаки, не витрачати токени на те, що простіше зробити вручну чи іншим інструментом.
Важливий момент: /insights працює локально. Звіт зберігається у файлі на вашій машині, а не виноситься кудись у хмару додатково до того, що вже й так передається моделі під час роботи. Це робить інструмент зручним для тих, хто уважно ставиться до конфіденційності робочих даних.
У підсумку /insights — це спосіб подивитися на себе як на користувача AI?інструменту з боку. Для розробника, який хоче не просто «балакати з моделлю», а системно підвищувати власну продуктивність, це один із найцінніших вбудованих інструментів Claude Code.
Вартість, контекст і приховані інструменти: як /cost, /context і вимкнення MCP?тулів економлять токени
Питання вартості використання великих мовних моделей давно вийшло за межі «скільки коштує підписка». У Claude Code це особливо помітно: навіть маючи фіксований тариф, можна працювати дуже по?різному — від обережного використання до повного вичерпання лімітів за кілька днів. Тут у гру вступають команди /cost і /context.
Команда /cost показує, скільки коштує поточне використання API. Якщо ви працюєте через пряме API?білінг із оплатою за токени, це дає прозору картину витрат: можна побачити, наскільки «важкими» виявилися останні сесії, і скоригувати поведінку. Якщо ж ви на фіксованій підписці (наприклад, тому самому плані за 20 доларів на місяць), /cost покаже нуль, оскільки ви не платите безпосередньо за токени. Але це не означає, що ресурс безмежний — у таких планах зазвичай є usage?ліміти, які можна вичерпати, навіть не помітивши цього.
Набагато глибше зрозуміти, куди саме йдуть токени, дозволяє команда /context. Вона показує поточне використання контексту: скільки токенів уже зайнято, яка загальна місткість, який відсоток припадає на системний промпт, інструменти, навички (skills), повідомлення користувача та «вільний простір». У прикладі з гайду видно, як Claude Code показує, що вже використано 25 тисяч токенів із доступного мільйона, а також розкладає це по категоріях.
Особливо показовий блок із MCP?інструментами. Claude Code може підключати велику кількість MCP?серверів і тулів — від GitHub до Zapier. Але кожен підключений інструмент збільшує контекст, який модель має «тримати в голові». Якщо в сесії активні десятки тулів, якими ви фактично не користуєтеся, вони просто «роздувають» контекст, уповільнюють відповіді й збільшують витрати токенів.
Саме тому рекомендується вимикати MCP?інструменти, які не потрібні в поточній сесії. Це не лише економить токени, а й робить поведінку Claude Code більш передбачуваною: модель не намагається «думати» через зайві інструменти, які ви не плануєте використовувати. У прикладі з гайду згадуються численні Zapier?тулзи, які просто висять у контексті, хоча зараз не потрібні, — класична ситуація, коли «зайва магія» починає шкодити.
Таким чином, /context — це не просто діагностичний екран, а інструмент для прийняття рішень: які інструменти залишити, які вимкнути, коли варто «очистити» історію, а коли — змінити модель на дешевшу. У поєднанні з /cost він дає розробнику контроль над тим, що зазвичай залишається «під капотом» LLM?сервісів.
/compact: як «очистити» історію, не втративши нитку розмови
Ще одна команда, яка безпосередньо впливає на ефективність довгих сесій у Claude Code, — /compact. Вона вирішує типову проблему: що робити, коли історія діалогу розрослася до такого розміру, що починає тиснути на контекстне вікно, уповільнювати відповіді й збільшувати вартість кожного запиту?
Механіка /compact проста, але продумана. Команда бере поточну історію розмови, стискає її до короткого резюме й очищає детальні повідомлення з контексту. У результаті в сесії залишається невеликий текстовий підсумок того, що відбувалося раніше, а не повний лог усіх обмінів. Це різко скорочує кількість токенів, які модель змушена «переварювати» при кожній новій відповіді.
Такий підхід особливо корисний у тривалих робочих сесіях, де ви поступово розвиваєте один і той самий проєкт: спочатку обговорюєте архітектуру, потім генеруєте код, потім виправляєте баги, додаєте тести, інтегруєте зовнішні сервіси. Через кілька годин історія може налічувати десятки або сотні повідомлень. Без компактного резюме модель змушена щоразу «читати» все це, навіть якщо більшість деталей уже неактуальні.
Водночас важливо розуміти, що /compact — не універсальна панацея. Є сценарії, де повна історія критично важлива: наприклад, коли ви покроково розбираєте складний алгоритм або ведете детальний аудит змін у коді. У таких випадках агресивне стиснення історії може призвести до втрати важливих нюансів. Саме тому в гайді наголошується: /compact — це інструмент, про який варто знати й використовувати свідомо, а не «кнопка, яку потрібно тиснути завжди».
З практичної точки зору, оптимальна стратегія виглядає так: стежити за показниками /context, і коли видно, що історія починає займати значну частину контексту, приймати рішення — чи можна безпечно стиснути її до резюме. Якщо так, /compact дозволяє продовжити роботу в тій самій сесії, не починаючи все з нуля й не втрачаючи загальну картину.
Прихована інфраструктура Claude Code: .claude, рівні конфігурації та роль MCP
Хоча основний фокус цього матеріалу — моделі й команди для оптимізації сесій, варто коротко згадати ще один важливий аспект, який впливає на те, як працюють контекст і інструменти: файлову структуру й рівні конфігурації Claude Code.
У кожному проєкті, де ви працюєте з Claude Code, інструмент автоматично створює приховану директорію .claude. Усередині зберігаються налаштування, специфічні для цього проєкту, зокрема файл settings.local.json. Саме сюди потрапляють конфігурації, які ви додаєте на рівні проєкту: наприклад, MCP?сервери, навички (skills) чи інші локальні параметри.
Claude Code підтримує кілька рівнів конфігурації: проєктний, користувацький і глобальний. Це означає, що той самий MCP?сервер або інший інструмент можна додати лише для поточного проєкту, для всіх проєктів поточного користувача або для всієї інсталяції загалом. Від обраного рівня залежить, де саме інструмент буде доступний і як він впливатиме на контекст.
Наприклад, GitHub MCP?сервер, який дозволяє Claude Code автоматично створювати віддалені репозиторії та пушити туди код, логічно додати на глобальному (user) рівні, оскільки він корисний у більшості проєктів. Для цього використовується спеціальна команда додавання MCP?сервера з параметром -d-scope user. Якщо ж додати його лише на рівні поточного проєкту, він не з’явиться в інших сесіях, і доведеться повторювати налаштування.
Керувати MCP?серверами зсередини Claude Code допомагає команда /mcp. Вона показує список доступних серверів, їхній статус (увімкнені, вимкнені, вбудовані) й дозволяє швидко перевірити, чи правильно підключено, наприклад, той самий GitHub. Це знову ж таки впирається в контекст: чим більше глобальних інструментів ви підключаєте, тим уважніше потрібно стежити за тим, які з них реально використовуються в конкретній сесії.
Таким чином, прихована папка .claude і система рівнів конфігурації — це фундамент, на якому будуються всі описані вище оптимізації. Розуміння того, де зберігаються налаштування й як вони впливають на доступні інструменти, допомагає уникнути ситуацій, коли контекст «роздутий» через глобально підключені, але фактично не потрібні MCP?сервери.
Висновки: Claude Code як інструмент, яким потрібно вміти керувати
Claude Code — це вже не просто «чат із моделлю в терміналі», а повноцінне середовище для розробників, де від користувача очікується певний рівень дисципліни. Щоб отримати максимум користі й мінімізувати витрати, важливо не лише писати хороші промпти, а й свідомо керувати моделями, контекстом і інструментами.
Перемикання моделей через /model дозволяє підібрати оптимальний баланс між потужністю й вартістю: Sonnet як базовий варіант, Opus для справді складних задач, Haiku для простих і довготривалих операцій. Команди /insights, /cost і /context дають прозору картину того, як ви працюєте з Claude Code, скільки це коштує й куди саме йдуть токени. Вимкнення непотрібних MCP?інструментів і використання /compact у потрібний момент допомагають утримувати контекст у розумних межах, не жертвуючи якістю роботи.
Усе це разом перетворює Claude Code з «чорної скриньки» на керований інструмент, який можна налаштовувати під свій стиль роботи й конкретні проєкти. Для розробників, які проводять у таких середовищах години щодня, саме ці дрібні на перший погляд деталі — вибір моделі, стан контексту, структура конфігурацій — і визначають, чи стане AI?асистент справжнім прискорювачем роботи, чи ще одним джерелом прихованих витрат.
Джерело
The Ultimate Claude Code Guide | MCP, Skills & More — Tech With Tim


