Claude Code стає популярним інструментом для розробників, але разом із зручністю приходять і витрати — насамперед на токени. Канал KODARIK у своєму матеріалі розбирає один із ключових механізмів, що впливають на споживання токенів, — Syning Mode, та показує, як його контролювати через конфігурацію проєкту.

Що таке Syning Mode і чому він витрачає більше токенів
У налаштуваннях Claude Code, які відкриваються командою Config, є пункт Syning Mode. За замовчуванням він увімкнений.
Суть режиму така:
- при кожному запиті агент автоматично вирішує, чи потрібно «подумати довше» над задачею;
- якщо задача здається складнішою, модель витрачає більше часу та токенів на глибше обдумування;
- це «додаткове обдумування» і є тим, що збільшує підсумкові витрати.
Якщо не змінювати налаштувань, Claude Code може витрачати близько 30 000 токенів на ці додаткові зусилля з аналізу запиту.
Керування Syning Mode через settings.json
Щоб узяти під контроль цей механізм, потрібно перейти до файлу конфігурації проєкту — settings.json. У ньому вже можуть бути визначені змінні, і до них додаються ще дві:
-
cloud_code_disable_adaptive_syning
Відповідає за вимкнення автоматичного режиму Syning Mode. -
1— режим відключений (true, disable); 0— режим увімкнений.
Тобто, щоб вимкнути автоматичне «глибоке обдумування» для всіх запитів, у settings.json потрібно задати:
json
"cloud_code_disable_adaptive_syning": 1
max_syning_tokens
Визначає максимальну кількість токенів, яку Claude Code може витратити на поглиблений аналіз задачі.
Важливий момент: це значення має працювати в парі з попереднім. Якщо max_syning_tokens не визначено, за замовчуванням використовується приблизно 30 000 токенів. При цьому авторка зауважує, що max_syning_tokens без cloud_code_disable_adaptive_syning може не працювати коректно, тому обидві змінні варто задавати разом.
Таким чином, розробник отримує можливість:
- або повністю вимкнути адаптивний Syning Mode;
- або обмежити його «апетит» за допомогою
max_syning_tokens.
Як зберегти якість відповіді без зайвих витрат
Вимкнення автоматичного Syning Mode не означає, що Claude Code почне працювати гірше. Замість того, щоб модель сама вирішувала, коли «думати глибше», ініціатива переходить до користувача.
Після вимкнення автоматичного режиму, щоб активувати більш детальне обдумування для конкретного запиту, достатньо:
- явно вказати це в промпті — наприклад, попросити:
- «обдумай це більш детально»;
- «обдумай крок за кроком».
Тоді поглиблений аналіз вмикається точково, лише там, де це справді потрібно, а не для кожної дрібної задачі. Це дає змогу:
- зменшити загальне споживання токенів;
- зберегти високу якість відповідей у складних кейсах;
- уникати «перевитрати» на простих запитах, де додатковий аналіз не потрібен.
Практичний підхід до економії токенів
З технічної точки зору, стратегія виглядає так:
- Вимкнути адаптивний Syning Mode через
cloud_code_disable_adaptive_syning: 1. - Задати обмеження через
max_syning_tokens, щоб контролювати верхню межу витрат на глибоке обдумування. - Використовувати детальне мислення лише за потреби, додаючи відповідні інструкції в промпт.
Такий підхід перетворює Syning Mode з «чорної скриньки», яка сама вирішує, скільки ресурсів витрачати, на керований інструмент, що працює за правилами, встановленими розробником.


