Інструменти на кшталт Claude Code стрімко стають стандартом у роботі розробників: від генерації коду до проєктування архітектури. Але разом із продуктивністю приходить інша реальність — рахунки за токени, які легко «вилітають» за кілька сесій. Український розробник і автор каналу KODARIK на власному досвіді розбирає, як влаштована оплата Claude Code, які є тарифи, ліміти й механіка витрат. На основі цієї розмови розглянемо, як саме працює економіка Claude Code і чому розуміння токенів та обмежень важливе не менше, ніж уміння писати промпти.
![]()
Підписка чи API: дві моделі оплати, одна проблема — токени
Claude Code можна використовувати двома принципово різними способами. Перший — це фіксована підписка, коли користувач платить за доступ до сервісу й отримує певні ліміти використання. Другий — інтеграція через API з оплатою за кожен використаний токен.
У випадку підписки користувачеві не потрібно щоразу думати про конкретну ціну кожного запиту: він працює в межах виділених лімітів. Але як тільки починається активна розробка, стає помітно, що навіть у фіксованій моделі токени — це реальна валюта. Вони витрачаються на кожен запит, кожну відповідь і кожен байт контексту, який Claude Code змушений «пам’ятати».
API-модель ще пряміша: кожен токен має свою ціну, і будь-яка неефективність одразу перетворюється на гроші. Тут немає «подушки» у вигляді передплачених лімітів — усе, що відправлено й отримано, рахується й оплачується. Тому питання економії токенів стає критичним і для тих, хто працює за підпискою, і для тих, хто інтегрує Claude Code у власні сервіси через API.
У підсумку, незалежно від моделі оплати, користувачеві доводиться мати справу з однаковою базовою реальністю: токени — це ресурс, який має ціну, а отже, будь-яка зайва «балакучість» моделі, надмірний контекст або невдалий вибір моделі напряму впливають на фінальний рахунок.
Тарифи Claude: від мінімального Pro до «важкої артилерії» за 100 доларів
Щоб отримати доступ до Claude Code, безкоштовного рівня недостатньо. Безплатний тариф дозволяє спілкуватися з Claude як із чат‑моделлю, але не відкриває можливостей саме Claude Code. Для роботи з кодом потрібна мінімальна платна підписка — Claude Pro.
Claude Pro — це базовий платний рівень, з якого починається повноцінна робота з Claude Code. Він коштує 17 доларів на місяць, якщо оплачувати рік наперед. Така модель підходить тим, хто впевнений, що користуватиметься сервісом регулярно й готовий одразу зафіксувати витрати на рік. При помісячній оплаті ціна вища: 20 доларів плюс ПДВ, що в підсумку дає приблизно 24 долари на місяць.
У межах Claude Pro ліміти не можна назвати надто щедрими, але їх достатньо для невеликих і середніх проєктів. Якщо ж уважно ставитися до вибору моделі, контексту й промптів, цих лімітів може вистачити навіть для проєктів, що виходять за межі «середнього» обсягу. Саме на цьому рівні більшість індивідуальних розробників і невеликих команд відчувають, як сильно на витрати впливає стиль роботи з Claude Code.
Над Claude Pro розташований максимальний тариф Claude для Claude Code. Він коштує 100 доларів плюс ПДВ на місяць і надає приблизно у 5–20 разів вищі ліміти використання, ніж Pro. Цей діапазон пов’язаний із тим, як саме розподіляються ліміти між різними типами запитів і моделями, але загальна логіка проста: це тариф для інтенсивної роботи, коли Claude Code використовується щодня, у великих командах або в рамках масштабних проєктів.
Важливо, що навіть на максимальному тарифі питання економії токенів не зникає. Вищі ліміти полегшують життя, але не скасовують базової механіки: будь-який надлишковий контекст, неправильний вибір моделі чи бездумна робота з довгими сесіями продовжують множити витрати. А якщо поверх підписки починає нараховуватися extra usage, то навіть тариф за 100 доларів може виявитися лише стартовою точкою.
Як працюють токени і чому ліміти «падають» за кілька годин
Щоб зрозуміти, звідки беруться великі рахунки, потрібно розібратися, як саме Claude Code рахує токени. У спрощеному вигляді токени — це умовна «вага» слів, букв і символів. Кожен запит, який користувач вводить у Claude Code, перетворюється на послідовність токенів. Те саме відбувається з відповіддю моделі. У підсумку для кожної взаємодії рахується сумарна кількість токенів, які потрібно обробити.
Кожен тариф має свої ліміти токенів, і Claude Code накладає на них одразу два ковзні обмеження: п’ятигодинне й семиденне. Це означає, що система відстежує, скільки токенів було витрачено за останні п’ять годин і за останні сім днів, незалежно від календарних меж. Якщо один із цих лімітів вичерпується, користувач стикається з обмеженнями на подальшу роботу.
У стандартному інтерфейсі Claude Code ці ліміти відображаються внизу екрана у вигляді статус‑бару. Там показано, який відсоток п’ятигодинного ліміту вже використано, і який відсоток семиденного. Поруч зазначається час наступного оновлення, коли частина ліміту «звільниться» завдяки тому, що старі запити вийдуть за межі відповідного вікна.
Окрім візуального індикатора, є й окрема команда для перегляду лімітів. Вона виводить детальні дані: відсоток використання п’ятигодинного й семиденного лімітів, а також інформацію про extra usage — додатковий обсяг токенів, який можна витратити понад базові обмеження.
Саме тут стає очевидно, чому в деяких користувачів ліміти «згорають» за кілька запитів. Якщо працювати з потужними моделями, тримати довгі сесії з великим контекстом і не контролювати обсяг відповідей, кожен окремий діалог може споживати величезну кількість токенів. А оскільки ліміти рахуються в обох часових вікнах одночасно, інтенсивна робота протягом кількох годин здатна майже повністю вичерпати і п’ятигодинний, і тижневий запас.
Коли один із лімітів досягає 100%, Claude Code перестає дозволяти нові запити в межах підписки до наступного оновлення. У цей момент у гру вступає extra usage.
Extra usage: прихована друга «лінія» оплати
Окрім базових лімітів, що входять у підписку, Claude Code має ще один важливий механізм — extra usage. Це додатковий пул токенів, який можна використовувати, коли п’ятигодинний або семиденний ліміт вичерпано. На перший погляд, це зручно: робота не зупиняється, навіть якщо ви «вибилися» з лімітів. Але є нюанс — extra usage оплачується окремо, понад вартість підписки.
У тій самій команді перегляду лімітів, де показуються відсотки використання основних квот, відображається й extra usage. Це дозволяє зрозуміти, скільки додаткових токенів уже витрачено й наскільки глибоко користувач зайшов у зону платного перевищення.
Особливо важливо враховувати extra usage при роботі з моделями, які мають збільшене вікно контексту. Claude Code пропонує парні моделі Sonnet і Opus із різними розмірами контексту — приблизно 1 000 000 і 200 000 токенів. Моделі з мільйонним контекстом дають змогу тримати в пам’яті величезні обсяги коду й історії діалогу, але це має ціну: використання таких моделей призводить до додаткових списань, які не покриваються підпискою й одразу йдуть у extra usage.
Фактично, вибір моделі з контекстом на 1 млн токенів — це автоматичне погодження на підвищені витрати. Навіть якщо базові ліміти ще не вичерпані, частина навантаження з таких сесій потрапляє в extra usage, і користувач починає платити понад тариф. Тому для тих, хто хоче тримати витрати під контролем, логічно уникати моделей із мільйонним контекстом, якщо в цьому немає критичної потреби.
У підсумку extra usage перетворюється на другу, менш помітну «лінію» оплати. Підписка створює відчуття фіксованої вартості, але як тільки робота стає інтенсивною, а моделі — «важкими», саме extra usage починає визначати реальну ціну Claude Code.
Контекст, моделі й мова промптів: як технічні деталі перетворюються на гроші
Ще один ключовий фактор витрат — те, як Claude Code працює з контекстом. Сервіс підтримує умовну «пам’ять» діалогу: кожен запит користувача й кожна відповідь моделі зберігаються в контексті. При кожному наступному повідомленні весь цей контекст знову прикріплюється до запиту й відправляється моделі. Тобто з кожним кроком кількість токенів, що передаються, зростає.
Це зручно з погляду безперервності діалогу: модель «пам’ятає», про що йшлося раніше, і може опиратися на попередні рішення. Але з фінансового погляду це означає, що довгі сесії з великою кількістю промптів і відповідей стають дедалі дорожчими. Модель змушена щоразу обробляти не лише новий запит, а й усю історію, яка до нього привела.
Claude Code має вбудований механізм автоматичного стиснення контексту. Коли він стає надто великим, система не просто видаляє старі повідомлення, а підбиває підсумки, виділяє найважливіше й позбавляється «води» та другорядних деталей. Це дозволяє зменшити обсяг токенів, які потрібно передавати, і водночас зберегти ключову інформацію для продовження роботи.
Однак навіть із таким механізмом контекст залишається головною точкою витрат. Чим довше триває сесія, чим більше в ній відгалужень, уточнень і дрібних правок, тим дорожче обходиться кожен наступний крок. Саме тому багато практик економії токенів зводяться до управління контекстом: розбиття роботи на окремі сесії, контроль за тим, що саме потрапляє в «пам’ять», і свідомий вибір моменту, коли варто почати «з нуля».
Не менш важливий і вибір моделі. Claude Code пропонує три основні сімейства: Haiku, Sonnet і Opus. Haiku — найекономніша модель, оптимальна для простих завдань, на кшталт дрібних змін у коді чи не надто складних трансформацій. Sonnet — баланс між розумністю й вартістю, саме її розробники рекомендують для приблизно 90% щоденних задач. Opus — найпотужніша модель, яка краще підходить для складної архітектури, нетривіальних рішень і глибокого аналізу, але вона споживає приблизно утричі більше токенів, ніж Sonnet для тих самих завдань.
Вибір між цими моделями — це завжди вибір між якістю й ціною. Використовувати Opus для дрібних правок у стилі «зміни колір кнопки» означає платити в рази більше за те, що Haiku або Sonnet зробили б не гірше. І навпаки, намагатися вирішити складну архітектурну задачу на Haiku може призвести до довшого діалогу, більшої кількості уточнень і, як наслідок, до ще більших витрат.
Цікаво, що навіть мова промптів впливає на витрати. Англійська токенізується ефективніше, ніж багато інших мов, зокрема українська чи російська. У результаті написання промптів англійською може зменшити використання токенів приблизно на 10–30%. Для тих, хто працює з Claude Code щодня, це перетворюється на відчутну різницю в рахунках.
Усі ці фактори — контекст, вибір моделі, мова промптів — на перший погляд здаються технічними деталями. Але в реальності саме вони визначають, чи вкладеться користувач у ліміти підписки, чи почне регулярно заходити в extra usage.
Висновок: Claude Code не «жере токени» — він чесно рахує все, що ви йому даєте
Claude Code часто сприймають як інструмент, який «жере токени» й миттєво вичерпує ліміти. Але якщо подивитися на механіку уважніше, стає зрозуміло: сервіс просто чесно рахує кожен байт інформації, який користувач відправляє й отримує. Підписка задає рамки, але не скасовує базового принципу — токени мають ціну, і будь-яка зайва інформація коштує грошей.
Мінімальний платний рівень — Claude Pro — відкриває доступ до Claude Code за 17 доларів на місяць при річній оплаті або приблизно 24 долари при помісячній. Максимальний тариф за 100 доларів плюс ПДВ дає у 5–20 разів вищі ліміти, але не позбавляє від extra usage, якщо користувач активно працює з потужними моделями й великим контекстом. П’ятигодинні й семиденні ковзні ліміти, статус‑бар із відсотками використання, окрема команда для перегляду лімітів і extra usage — усе це елементи однієї системи, яка намагається зробити витрати прозорими.
Розуміння того, як працюють токени, як формується контекст, чим відрізняються Haiku, Sonnet і Opus, а також як саме додаткове використання виходить за межі підписки, — це вже не «просунуті фішки», а базова грамотність для тих, хто серйозно працює з Claude Code. Без цього будь-який тариф, навіть найдорожчий, може виявитися несподівано тісним.
У наступних матеріалах логічно переходити від теорії до практики — до конкретних прийомів економії токенів, оптимізації промптів і роботи з контекстом. Але фундамент залишається незмінним: перш ніж економити, потрібно чітко розуміти, за що саме ви платите.


