AI-лайфхаки 31 марта 2026 · 6 мин чтения

Почему «Привет» в Claude съедает 2% сессии — и как не сливать токены впустую

Вы написали Claude «Привет, как дела?» — и только что потратили ~2% своего лимита на 5 часов. Поблагодарили за ответ — ещё 2%. Пока дошли до реальной задачи, улетело 10% сессии. Разбираем, как на самом деле считаются токены, почему это важно и как работать с Claude так, чтобы лимит кончался на задачах, а не на светских беседах.

Визуализация расхода токенов. Источник: @mmmorozov

Что такое токены и почему русский текст дороже английского

Токен — это минимальная единица текста, которую обрабатывает языковая модель. Грубо говоря: 1 токен ≈ 4 символа на английском или 0,75 слова. Но с русским всё сложнее.

Большинство LLM-моделей обучены преимущественно на английском тексте. Русские слова чаще всего разбиваются на несколько токенов — кириллический символ в среднем занимает 1,5–2 токена против 0,25 токена для латинского. На практике это означает:

Сравнение стоимости одного и того же смысла:

ФразаЯзык~Токенов
HelloEN1
ПриветRU3–4
Thank you!EN3
Спасибо!RU5–6
Continue the taskEN3
Продолжай задачуRU7–8

Русский текст «съедает» токены в 2–3 раза быстрее, чем эквивалентный английский.

Важный нюанс: Claude тратит токены не только на ваш вопрос. Каждый раз, когда вы пишете сообщение, модель заново «читает» всю историю переписки плюс системный промпт. Чем длиннее сессия — тем дороже каждое следующее сообщение.

Как устроен лимит Claude Pro: 5-часовое окно

Claude Pro и Claude Max работают по системе 5-часового скользящего окна. Это означает: с момента первого сообщения запускается таймер на 5 часов, в рамках которого у вас есть определённый бюджет токенов. Как только окно закрывается — лимит сбрасывается.

Важно: с августа 2025 года Anthropic добавил ещё и недельный лимит для тяжёлых пользователей. Если вы активно используете Claude каждый день — может сработать недельная квота раньше, чем 5-часовое окно.

Реальные данные пользователей из Reddit показывают: на Claude Pro в 5-часовом окне помещается 10–40 обычных запросов в зависимости от их сложности. На Claude Max (20×) — 200–800 запросов. Разница колоссальная.

Вот как выглядит типичный расход за одну сессию у человека, который «болтает» с Claude:

«Привет, как дела?»
2%
«Спасибо, отлично!»
2%
«Можешь помочь мне?»
2%
«Продолжай» (после лимита)
20%
Реальная задача (код/анализ)
15%

К моменту настоящей работы — уже потрачено 26% лимита на разговоры ни о чём.

«Я написал "продолжай" после того, как достиг лимита — и это стоило мне 20% сессии за раз. Потому что Claude снова прочитал всю историю переписки» — пользователь Reddit r/ClaudeCode

Что на самом деле съедает токены в Claude

Большинство пользователей думают, что тратят токены только на свои сообщения. Это не так. Вот полная картина того, что входит в каждый запрос:

Именно поэтому команда /context в Claude Code показывает, сколько токенов реально загружено в текущую сессию. Часто пользователи удивляются: 2000 токенов на один «привет» — это не ваши слова, это системный промпт + история.

Claude Pro vs Codex: сравнение лимитов

ПараметрClaude Pro ($20/мес)Claude Max 5× ($100/мес)Claude Max 20× ($200/мес)OpenClaw / Codex
Окно сессии5 часов (rolling)5 часов (rolling)5 часов (rolling)Более гибкий лимит
Запросов в окне10–4050–200200–800Зависит от модели
Недельный лимитЕсть (тяжёлым)МягчеНетПо API-плану
Контекстное окно200K токенов200K токенов200K токенов200K токенов
СбросКаждые 5 часовКаждые 5 часовКаждые 5 часовПо плану
Цена$20/мес$100/мес$200/месПо использованию

Codex и API-доступ к Claude работают иначе: вы платите за каждый токен отдельно, но нет жёсткого «окна». Это выгоднее для предсказуемых рабочих нагрузок, но может быть дороже при интенсивной работе.

10 правил экономии токенов в Claude

01

Никакого small talk. Начинайте сразу с задачи. «Проанализируй этот текст:» — не «Привет, можешь помочь?»

02

Новые задачи — новые чаты. Каждый новый проект начинайте в свежем окне — история не тянется и не съедает токены.

03

Пишите на английском. Для технических задач — EN дешевле RU в 2–3 раза по токенам.

04

Не загружайте лишние файлы. Прикрепляйте только нужные части документов, не весь файл.

05

Избегайте «продолжай». Это одно из самых дорогих слов — Claude перечитывает весь контекст. Лучше начните новый чат с конкретной задачей.

06

Используйте /compact в Claude Code. Команда сжимает историю, сохраняя суть и освобождая токены.

07

Отключайте неиспользуемые скиллы. Каждый установленный скилл добавляет к системному промпту.

08

Работайте в «пиковые» часы осторожно. С 9:00 до 17:00 EST Anthropic увеличивает стоимость токенов для одних и тех же задач — это задокументировано.

09

Структурируйте задачи чётко. Размытый промпт = длинный ответ = больше токенов. Prompt Master поможет написать лаконичный точный запрос.

10

Следите за /context. В Claude Code команда показывает реальный объём загруженного контекста — сразу видно, где жирно.

Русский vs английский: сколько теряете каждый день

Посчитаем на реальном примере. Допустим, вы используете Claude Pro ($20/мес) и за 5-часовую сессию у вас есть бюджет условно на 100 «единиц работы».

Сценарий: разработчик пишет задачи на русском

Переход на английский для технических промптов экономит 30–50% токенов за сессию. На Claude Pro ($20) — это почти удвоение полезной работы в рамках лимита.

Что делать, если лимит кончился

  1. Подождать сброса окна — через 5 часов с первого сообщения лимит обнуляется.
  2. Переключиться на другую модель — Claude.ai позволяет выбрать менее ресурсоёмкую модель.
  3. Использовать API — прямой доступ к Claude через API не имеет «окна», платите за токены.
  4. Claude Max — если лимиты Claude Pro регулярно кончаются, $100/мес за 5× — разумное вложение.
  5. OpenClaw с Codex — более гибкие лимиты для агентных задач и автоматизации.

FAQ

Почему «Привет» стоит именно 2% сессии, а не меньше?
Потому что ваше слово «Привет» — это лишь верхушка айсберга. К нему прибавляется системный промпт Claude (несколько сотен токенов), история разговора (если она есть) и все загруженные инструменты/скиллы. Само слово «Привет» — 3–4 токена. Но overhead от контекста превращает это в 2% от лимита 5-часовой сессии на Pro-плане.
Считает ли Claude токены в ответе тоже?
Да. Тратятся и входящие (ваш промпт + контекст), и исходящие токены (ответ Claude). При этом исходящие токены исторически дороже входящих в API-тарификации. В Claude Pro/Max — всё засчитывается в общий лимит окна.
Помогает ли команда /compact в Claude Code?
Да, это один из самых эффективных инструментов. /compact сжимает историю диалога до краткого резюме, сохраняя ключевые решения и контекст. После этого каждый следующий запрос «видит» маленький контекст вместо длинной истории — экономия 40–70% на дальнейших запросах в той же сессии.
Стоит ли переходить с Claude Pro на Claude Max ради лимитов?
Если вы регулярно упираетесь в лимит — да. Claude Max 5× ($100/мес) даёт в 5 раз больше возможностей в том же 5-часовом окне. При цене $20 за Pro и $100 за Max 5× — это $80 доплаты за 5× производительность. Для профессионального использования — оправдано.
Сбрасывается ли лимит в полночь или через 5 часов?
Через 5 часов с момента первого сообщения в сессии — скользящее окно, не календарные сутки. Это значит, что если вы начали работу в 23:00, в 04:00 лимит обнулится. Выгодно начинать сессию под конец рабочего дня — к утру уже свежий лимит.
Как Codex и OpenClaw отличаются от Claude Pro по лимитам?
OpenClaw с Codex работает через API без жёсткого 5-часового окна — лимиты более резиновые и предсказуемые. Платите за фактически использованные токены, а не за «место в окне». Для агентных задач и автоматизации — принципиально другой уровень свободы.

Читайте также: как писать точные промпты для Claude и экономить токены с помощью Prompt Master, и что умеет Claude Code для разработки.

Хотите использовать Claude без ограничений?

Настраиваем AI-агентов и автоматизацию через OpenClaw — без жёстких лимитов и потерь на «привет».

→ Написать в Telegram