AI-лайфхаки 31 марта 2026 · 6 мин чтения

Почему «Привет» в Claude съедает 2% сессии — и как не сливать токены впустую

Вы написали Claude «Привет, как дела?» — и только что потратили ~2% своего лимита на 5 часов. Поблагодарили за ответ — ещё 2%. Пока дошли до реальной задачи, улетело 10% сессии. Разбираем, как на самом деле считаются токены, почему это важно и как работать с Claude так, чтобы лимит кончался на задачах, а не на светских беседах.

Визуализация расхода токенов. Источник: @mmmorozov

Что такое токены и почему русский текст дороже английского

Токен — это минимальная единица текста, которую обрабатывает языковая модель. Грубо говоря: 1 токен ≈ 4 символа на английском или 0,75 слова. Но с русским всё сложнее.

Большинство LLM-моделей обучены преимущественно на английском тексте. Русские слова чаще всего разбиваются на несколько токенов — кириллический символ в среднем занимает 1,5–2 токена против 0,25 токена для латинского. На практике это означает:

Сравнение стоимости одного и того же смысла:

Фраза	Язык	~Токенов
Hello	EN	1
Привет	RU	3–4
Thank you!	EN	3
Спасибо!	RU	5–6
Continue the task	EN	3
Продолжай задачу	RU	7–8

Русский текст «съедает» токены в 2–3 раза быстрее, чем эквивалентный английский.

Важный нюанс: Claude тратит токены не только на ваш вопрос. Каждый раз, когда вы пишете сообщение, модель заново «читает» всю историю переписки плюс системный промпт. Чем длиннее сессия — тем дороже каждое следующее сообщение.

Как устроен лимит Claude Pro: 5-часовое окно

Claude Pro и Claude Max работают по системе 5-часового скользящего окна. Это означает: с момента первого сообщения запускается таймер на 5 часов, в рамках которого у вас есть определённый бюджет токенов. Как только окно закрывается — лимит сбрасывается.

Важно: с августа 2025 года Anthropic добавил ещё и недельный лимит для тяжёлых пользователей. Если вы активно используете Claude каждый день — может сработать недельная квота раньше, чем 5-часовое окно.

Реальные данные пользователей из Reddit показывают: на Claude Pro в 5-часовом окне помещается 10–40 обычных запросов в зависимости от их сложности. На Claude Max (20×) — 200–800 запросов. Разница колоссальная.

Вот как выглядит типичный расход за одну сессию у человека, который «болтает» с Claude:

«Привет, как дела?»

«Спасибо, отлично!»

«Можешь помочь мне?»

«Продолжай» (после лимита)

20%

Реальная задача (код/анализ)

15%

К моменту настоящей работы — уже потрачено 26% лимита на разговоры ни о чём.

«Я написал "продолжай" после того, как достиг лимита — и это стоило мне 20% сессии за раз. Потому что Claude снова прочитал всю историю переписки» — пользователь Reddit r/ClaudeCode

Что на самом деле съедает токены в Claude

Большинство пользователей думают, что тратят токены только на свои сообщения. Это не так. Вот полная картина того, что входит в каждый запрос:

Системный промпт — инструкции, которые Anthropic или вы настраиваете для Claude. Может занимать сотни токенов даже без вашего ведома.
Вся история диалога — каждое предыдущее сообщение в сессии переотправляется модели при каждом новом запросе.
Загруженные файлы и документы — один PDF на 20 страниц = тысячи токенов при каждом обращении.
Установленные скиллы и инструменты — каждый скилл добавляет токены к системному промпту.
Ваш текущий вопрос — и только потом сам ответ Claude.

Именно поэтому команда /context в Claude Code показывает, сколько токенов реально загружено в текущую сессию. Часто пользователи удивляются: 2000 токенов на один «привет» — это не ваши слова, это системный промпт + история.

Claude Pro vs Codex: сравнение лимитов

Параметр	Claude Pro ($20/мес)	Claude Max 5× ($100/мес)	Claude Max 20× ($200/мес)	OpenClaw / Codex
Окно сессии	5 часов (rolling)	5 часов (rolling)	5 часов (rolling)	Более гибкий лимит
Запросов в окне	10–40	50–200	200–800	Зависит от модели
Недельный лимит	Есть (тяжёлым)	Мягче	Нет	По API-плану
Контекстное окно	200K токенов	200K токенов	200K токенов	200K токенов
Сброс	Каждые 5 часов	Каждые 5 часов	Каждые 5 часов	По плану
Цена	$20/мес	$100/мес	$200/мес	По использованию

Codex и API-доступ к Claude работают иначе: вы платите за каждый токен отдельно, но нет жёсткого «окна». Это выгоднее для предсказуемых рабочих нагрузок, но может быть дороже при интенсивной работе.

10 правил экономии токенов в Claude

Никакого small talk. Начинайте сразу с задачи. «Проанализируй этот текст:» — не «Привет, можешь помочь?»

Новые задачи — новые чаты. Каждый новый проект начинайте в свежем окне — история не тянется и не съедает токены.

Пишите на английском. Для технических задач — EN дешевле RU в 2–3 раза по токенам.

Не загружайте лишние файлы. Прикрепляйте только нужные части документов, не весь файл.

Избегайте «продолжай». Это одно из самых дорогих слов — Claude перечитывает весь контекст. Лучше начните новый чат с конкретной задачей.

Используйте /compact в Claude Code. Команда сжимает историю, сохраняя суть и освобождая токены.

Отключайте неиспользуемые скиллы. Каждый установленный скилл добавляет к системному промпту.

Работайте в «пиковые» часы осторожно. С 9:00 до 17:00 EST Anthropic увеличивает стоимость токенов для одних и тех же задач — это задокументировано.

Структурируйте задачи чётко. Размытый промпт = длинный ответ = больше токенов. Prompt Master поможет написать лаконичный точный запрос.

Следите за /context. В Claude Code команда показывает реальный объём загруженного контекста — сразу видно, где жирно.

Русский vs английский: сколько теряете каждый день

Посчитаем на реальном примере. Допустим, вы используете Claude Pro ($20/мес) и за 5-часовую сессию у вас есть бюджет условно на 100 «единиц работы».

Сценарий: разработчик пишет задачи на русском

«Напиши функцию для валидации email» — 12 токенов на RU против 5 на EN
Ответ Claude (одинаковый) — 200 токенов
«Добавь обработку ошибок» — 8 токенов на RU против 3 на EN
«Напиши тесты» — 5 токенов на RU против 2 на EN

Переход на английский для технических промптов экономит 30–50% токенов за сессию. На Claude Pro ($20) — это почти удвоение полезной работы в рамках лимита.

Что делать, если лимит кончился

Подождать сброса окна — через 5 часов с первого сообщения лимит обнуляется.
Переключиться на другую модель — Claude.ai позволяет выбрать менее ресурсоёмкую модель.
Использовать API — прямой доступ к Claude через API не имеет «окна», платите за токены.
Claude Max — если лимиты Claude Pro регулярно кончаются, $100/мес за 5× — разумное вложение.
OpenClaw с Codex — более гибкие лимиты для агентных задач и автоматизации.

FAQ

Почему «Привет» стоит именно 2% сессии, а не меньше?

Потому что ваше слово «Привет» — это лишь верхушка айсберга. К нему прибавляется системный промпт Claude (несколько сотен токенов), история разговора (если она есть) и все загруженные инструменты/скиллы. Само слово «Привет» — 3–4 токена. Но overhead от контекста превращает это в 2% от лимита 5-часовой сессии на Pro-плане.

Считает ли Claude токены в ответе тоже?

Да. Тратятся и входящие (ваш промпт + контекст), и исходящие токены (ответ Claude). При этом исходящие токены исторически дороже входящих в API-тарификации. В Claude Pro/Max — всё засчитывается в общий лимит окна.

Помогает ли команда /compact в Claude Code?

Да, это один из самых эффективных инструментов. /compact сжимает историю диалога до краткого резюме, сохраняя ключевые решения и контекст. После этого каждый следующий запрос «видит» маленький контекст вместо длинной истории — экономия 40–70% на дальнейших запросах в той же сессии.

Стоит ли переходить с Claude Pro на Claude Max ради лимитов?

Если вы регулярно упираетесь в лимит — да. Claude Max 5× ($100/мес) даёт в 5 раз больше возможностей в том же 5-часовом окне. При цене $20 за Pro и $100 за Max 5× — это $80 доплаты за 5× производительность. Для профессионального использования — оправдано.

Сбрасывается ли лимит в полночь или через 5 часов?

Через 5 часов с момента первого сообщения в сессии — скользящее окно, не календарные сутки. Это значит, что если вы начали работу в 23:00, в 04:00 лимит обнулится. Выгодно начинать сессию под конец рабочего дня — к утру уже свежий лимит.

Как Codex и OpenClaw отличаются от Claude Pro по лимитам?

OpenClaw с Codex работает через API без жёсткого 5-часового окна — лимиты более резиновые и предсказуемые. Платите за фактически использованные токены, а не за «место в окне». Для агентных задач и автоматизации — принципиально другой уровень свободы.

Читайте также: как писать точные промпты для Claude и экономить токены с помощью Prompt Master, и что умеет Claude Code для разработки.

Хотите использовать Claude без ограничений?

Настраиваем AI-агентов и автоматизацию через OpenClaw — без жёстких лимитов и потерь на «привет».

→ Написать в Telegram