Визуализация расхода токенов. Источник: @mmmorozov
Токен — это минимальная единица текста, которую обрабатывает языковая модель. Грубо говоря: 1 токен ≈ 4 символа на английском или 0,75 слова. Но с русским всё сложнее.
Большинство LLM-моделей обучены преимущественно на английском тексте. Русские слова чаще всего разбиваются на несколько токенов — кириллический символ в среднем занимает 1,5–2 токена против 0,25 токена для латинского. На практике это означает:
| Фраза | Язык | ~Токенов |
|---|---|---|
| Hello | EN | 1 |
| Привет | RU | 3–4 |
| Thank you! | EN | 3 |
| Спасибо! | RU | 5–6 |
| Continue the task | EN | 3 |
| Продолжай задачу | RU | 7–8 |
Русский текст «съедает» токены в 2–3 раза быстрее, чем эквивалентный английский.
Важный нюанс: Claude тратит токены не только на ваш вопрос. Каждый раз, когда вы пишете сообщение, модель заново «читает» всю историю переписки плюс системный промпт. Чем длиннее сессия — тем дороже каждое следующее сообщение.
Claude Pro и Claude Max работают по системе 5-часового скользящего окна. Это означает: с момента первого сообщения запускается таймер на 5 часов, в рамках которого у вас есть определённый бюджет токенов. Как только окно закрывается — лимит сбрасывается.
Реальные данные пользователей из Reddit показывают: на Claude Pro в 5-часовом окне помещается 10–40 обычных запросов в зависимости от их сложности. На Claude Max (20×) — 200–800 запросов. Разница колоссальная.
Вот как выглядит типичный расход за одну сессию у человека, который «болтает» с Claude:
К моменту настоящей работы — уже потрачено 26% лимита на разговоры ни о чём.
«Я написал "продолжай" после того, как достиг лимита — и это стоило мне 20% сессии за раз. Потому что Claude снова прочитал всю историю переписки» — пользователь Reddit r/ClaudeCode
Большинство пользователей думают, что тратят токены только на свои сообщения. Это не так. Вот полная картина того, что входит в каждый запрос:
Именно поэтому команда /context в Claude Code показывает, сколько токенов реально загружено в текущую сессию. Часто пользователи удивляются: 2000 токенов на один «привет» — это не ваши слова, это системный промпт + история.
| Параметр | Claude Pro ($20/мес) | Claude Max 5× ($100/мес) | Claude Max 20× ($200/мес) | OpenClaw / Codex |
|---|---|---|---|---|
| Окно сессии | 5 часов (rolling) | 5 часов (rolling) | 5 часов (rolling) | Более гибкий лимит |
| Запросов в окне | 10–40 | 50–200 | 200–800 | Зависит от модели |
| Недельный лимит | Есть (тяжёлым) | Мягче | Нет | По API-плану |
| Контекстное окно | 200K токенов | 200K токенов | 200K токенов | 200K токенов |
| Сброс | Каждые 5 часов | Каждые 5 часов | Каждые 5 часов | По плану |
| Цена | $20/мес | $100/мес | $200/мес | По использованию |
Codex и API-доступ к Claude работают иначе: вы платите за каждый токен отдельно, но нет жёсткого «окна». Это выгоднее для предсказуемых рабочих нагрузок, но может быть дороже при интенсивной работе.
Никакого small talk. Начинайте сразу с задачи. «Проанализируй этот текст:» — не «Привет, можешь помочь?»
Новые задачи — новые чаты. Каждый новый проект начинайте в свежем окне — история не тянется и не съедает токены.
Пишите на английском. Для технических задач — EN дешевле RU в 2–3 раза по токенам.
Не загружайте лишние файлы. Прикрепляйте только нужные части документов, не весь файл.
Избегайте «продолжай». Это одно из самых дорогих слов — Claude перечитывает весь контекст. Лучше начните новый чат с конкретной задачей.
Используйте /compact в Claude Code. Команда сжимает историю, сохраняя суть и освобождая токены.
Отключайте неиспользуемые скиллы. Каждый установленный скилл добавляет к системному промпту.
Работайте в «пиковые» часы осторожно. С 9:00 до 17:00 EST Anthropic увеличивает стоимость токенов для одних и тех же задач — это задокументировано.
Структурируйте задачи чётко. Размытый промпт = длинный ответ = больше токенов. Prompt Master поможет написать лаконичный точный запрос.
Следите за /context. В Claude Code команда показывает реальный объём загруженного контекста — сразу видно, где жирно.
Посчитаем на реальном примере. Допустим, вы используете Claude Pro ($20/мес) и за 5-часовую сессию у вас есть бюджет условно на 100 «единиц работы».
Переход на английский для технических промптов экономит 30–50% токенов за сессию. На Claude Pro ($20) — это почти удвоение полезной работы в рамках лимита.
Читайте также: как писать точные промпты для Claude и экономить токены с помощью Prompt Master, и что умеет Claude Code для разработки.
Настраиваем AI-агентов и автоматизацию через OpenClaw — без жёстких лимитов и потерь на «привет».
→ Написать в Telegram