Claude Opus 4.7 — флагманская модель Anthropic, и через Promptra она стоит 350 ₽ за 1M входных токенов и 1790 ₽ за 1M выходных (это $5 / $25 по официальному прайсу Anthropic, пересчитанные по курсу ЦБ 71,668 ₽/$, без наценки на токены). Контекстное окно — 1M токенов, максимальный ответ — до 128K токенов. Платить можно на юр.лицо с полным пакетом закрывающих документов через ЭДО, а подключение — это замена двух строк в коде: api_key и base_url. Карта Anthropic для этого не нужна.
Дальше — разбор без маркетинга: где Opus 4.7 реально нужен, а где это дорогой оверкилл; почему новый токенайзер модели способен поднять фактический счёт примерно на треть и как это закладывать в бюджет; точные цены в рублях из нашего каталога; рабочий Python-код, который копируется в проект как есть; и честное сравнение с Claude Sonnet 4.6 и GPT-5.5. Все числа — на 2026-05-28.
Что такое Claude Opus 4.7 и для чего он
Opus — старшая модель в линейке Claude. Если Haiku оптимизирован под скорость и копеечную цену, а Sonnet — это «рабочая лошадка» с балансом качества и стоимости, то Opus 4.7 — это верхняя планка: модель, которую берут, когда задача слишком сложная для среднего класса и цена ошибки выше цены токенов. Подробнее — миграция с OpenAI SDK на Promptra за 10 минут.
Три параметра, которые определяют профиль модели (см. официальную страницу Claude Opus и документацию по моделям):
Контекст — 1M токенов. Это окно уровня «весь репозиторий целиком». Типичный backend-сервис на 60–80K строк кода умещается в него с запасом, вместе с историей диалога и системным промтом. Для агентов это значит, что модель держит весь рабочий контекст в одном проходе, без map-reduce и склейки кусков.
Максимальный ответ — до 128K токенов. Модель может выдать действительно длинный артефакт за один запрос: большой рефакторинг, многофайловый патч, развёрнутый разбор архитектуры. Это важно для агентных сценариев, где Sonnet и более лёгкие модели иногда упираются в потолок выходных токенов.
Профиль сильных сторон — сложный код, агенты, долгий reasoning. Opus берут не ради скорости (он заметно медленнее Sonnet) и не ради дешевизны. Его берут там, где нужно вытащить корректный результат из задачи, на которой средние модели начинают ошибаться: многошаговые цепочки рассуждений, отладка нетривиальных багов, агентные циклы с десятком инструментов, где важно ни разу не «потерять цель».
Где Opus 4.7 оправдывает свою цену:
- Сложный код и крупные рефакторинги — задачи, где надо удержать в голове весь модуль и не сломать инварианты при правке.
- Агенты с длинными циклами — tool-calling на 10–30 шагов, где накапливается контекст и важна стабильность между итерациями.
- Долгое рассуждение — задачи на планирование, декомпозицию, анализ trade-off'ов, где «первая мысль = ответ» не работает.
Где Opus 4.7 — это переплата: чат-боты на типовых вопросах, классификация, саммаризация, извлечение полей, массовая генерация шаблонного текста. Там корректнее брать Sonnet 4.6 или Haiku — об этом ниже отдельным блоком.
Цена Claude Opus 4.7 в рублях
Официальные цены Anthropic (прайс на платформе Claude) для Opus 4.7 — стандартный режим:
- Input: $5,00 за 1M токенов
- Output: $25,00 за 1M токенов
По курсу ЦБ на 2026-05-27 (71,668 ₽/$) и с округлением до 10 ₽ вниз, как во всём нашем каталоге:
| Параметр | $/1M | ₽/1M |
|---|---|---|
| Input (стандарт) | $5,00 | 350 ₽ |
| Output (стандарт) | $25,00 | 1790 ₽ |
| Input (fast mode) | $30,00 | 2150 ₽ |
| Output (fast mode) | $150,00 | 10 750 ₽ |
Через Promptra вы платите ровно эти рублёвые цены по курсу ЦБ на момент пополнения баланса, без наценки на каждый запрос. Сервисная комиссия 5% берётся только при пополнении (за эквайринг, биллинг и поддержку — не за токены). Это принципиальное отличие от реселлеров с фиксированной маржой 30–300% поверх токенов: на флагманской модели такая наценка превращается в кратную переплату на каждом миллионе.
Что такое fast mode и когда он нужен
Fast mode — это режим приоритетной обработки: те же ответы, но с гарантированно меньшей задержкой за счёт выделенной ёмкости. Стоит он ровно в 6 раз дороже стандартного ($30 / $150 против $5 / $25). Брать его имеет смысл только там, где латентность напрямую конвертируется в деньги или в UX: интерактивный copilot, на который смотрит живой пользователь, или продакшен-агент, где каждая секунда задержки множится на тысячи параллельных сессий. Для батч-обработки, ночных пайплайнов и фоновых задач fast mode — выброшенные деньги: стандартного режима достаточно.
Нюанс нового токенайзера: почему счёт может вырасти на треть
Это самый важный раздел статьи для тех, кто планирует бюджет. Opus 4.7 использует новый токенайзер, который на одном и том же тексте может расходовать до ~35% больше токенов, чем предыдущие модели Claude. Цена за токен при этом не меняется — меняется количество токенов, на которые бьётся ваш текст. А счёт считается именно в токенах.
Разберём механику. Токенайзер — это правило, по которому текст режется на токены (примерно «части слов»). У разных моделей правила разные. Если новый токенайзер дробит русский текст, код или служебную разметку мельче, то один и тот же промт превращается в большее число токенов. Платите вы за токены — значит, при прочих равных фактический счёт растёт пропорционально.
Что это значит для бюджета на конкретных числах. Возьмём объём текста, который на старом токенайзере стоил бы как 1M выходных токенов:
| Сценарий | Токенов на тот же текст | Цена output |
|---|---|---|
| Номинал (как 1M по старому счёту) | 1 000 000 | 1790 ₽ |
| Opus 4.7, верхняя оценка (+35%) | 1 350 000 | ≈ 2418 ₽ |
| Разница | +350 000 | +628 ₽ |
То есть в худшем случае каждый «миллион текста» обходится примерно на 628 ₽ дороже на выходе. На входе эффект тот же по проценту, но дешевле в абсолюте (input в 5 раз дешевле output).
Практические выводы:
-
+35% — это верхняя граница, а не средняя. Реальная надбавка зависит от языка и характера контента: на английском прозаическом тексте она обычно меньше, на плотном коде, JSON и кириллице может быть ближе к верхней оценке. Замеряйте на своём трафике через поле
usageв ответе — там точное число токенов. - Закладывайте запас в смету. Если вы считали бюджет по старым моделям, для Opus 4.7 разумно умножить ожидаемый расход токенов на 1,2–1,35 как страховку, а потом скорректировать по факту.
- Сравнивайте модели по итоговому счёту, а не по ставке за токен. Ставка Opus 4.7 ($5 / $25) совпадает с предыдущим Opus 4.6, но из-за токенайзера один и тот же текст на 4.7 может оказаться дороже в работе. Это не делает модель «плохой» — она и сильнее; просто это надо видеть в калькуляторе.
Самый надёжный способ не ошибиться — прогнать репрезентативную выборку своих реальных промтов и посмотреть фактический usage. Дальше — конкретный код, который это печатает.
Подключение: drop-in Python через Promptra
Главное по технической части: Promptra отдаёт OpenAI-совместимый endpoint. Это значит, что привычный openai SDK (Python, JS, Go — любой) работает без переписывания кода. Меняете только api_key и base_url — и тот же chat.completions.create начинает ходить в Claude Opus 4.7. Этот паттерн — официально поддерживаемый Anthropic drop-in через OpenAI SDK.
Шаг 1. Получить ключ
Регистрация на promptra.ru занимает минуту. После подтверждения телефона дашборд выдаёт ключ вида promptra_live_…. Ключ один на все модели каталога (Claude, GPT, Gemini, DeepSeek и др.), биллинг — с одного баланса.
Шаг 2. Обновить SDK
pip install --upgrade openai
# либо для JS/TS:
npm install openai
Достаточно openai>=1.50.0 для Python и openai@^5.0.0 для Node.
Шаг 3. Минимальный рабочий код
from openai import OpenAI
client = OpenAI(
api_key="promptra_live_xxx...", # ключ из дашборда Promptra
base_url="https://api.promptra.ru/v1", # вместо api.anthropic.com
)
response = client.chat.completions.create(
model="claude-opus-4-7", # имя модели через дефис
messages=[
{"role": "user", "content": "Кратко: чем reasoning-модель отличается от обычной?"}
],
)
print(response.choices[0].message.content)
# Печатаем фактический расход токенов — здесь видно влияние токенайзера
u = response.usage
print(f"\n--- input: {u.prompt_tokens} ток · output: {u.completion_tokens} ток")
Запускаете — получаете ответ и точное число потраченных токенов. Поле usage — ваш главный инструмент бюджетирования: именно по нему видно, насколько новый токенайзер «раздувает» ваши конкретные промты.
Шаг 4. Streaming для интерактива
Для copilot и чатов нужен стриминг — добавляете stream=True:
stream = client.chat.completions.create(
model="claude-opus-4-7",
messages=[{"role": "user", "content": "Спроектируй схему БД для биллинга по токенам"}],
max_tokens=8000,
stream=True,
)
for chunk in stream:
delta = chunk.choices[0].delta.content
if delta:
print(delta, end="", flush=True)
Шаг 5. Агент с tool-calling
Opus 4.7 силён именно в агентных циклах. Function calling работает через тот же OpenAI-совместимый контракт:
import json
from openai import OpenAI
client = OpenAI(
api_key="promptra_live_xxx...",
base_url="https://api.promptra.ru/v1",
)
tools = [{
"type": "function",
"function": {
"name": "run_tests",
"description": "Запускает тесты проекта и возвращает отчёт",
"parameters": {
"type": "object",
"properties": {"path": {"type": "string"}},
"required": ["path"],
},
},
}]
def execute_tool(name: str, args: dict) -> str:
if name == "run_tests":
return json.dumps({"passed": 42, "failed": 1, "failing": "test_billing_rounding"})
return "unknown tool"
messages = [
{"role": "system", "content": "Ты инженер. Чини баги, опираясь на отчёты тестов."},
{"role": "user", "content": "Прогони тесты в./src и почини то, что падает."},
]
for _ in range(30): # длинный agent loop — профиль Opus
resp = client.chat.completions.create(
model="claude-opus-4-7",
messages=messages,
tools=tools,
tool_choice="auto",
)
msg = resp.choices[0].message
messages.append(msg.model_dump)
if not msg.tool_calls:
print(msg.content)
break
for call in msg.tool_calls:
result = execute_tool(call.function.name, json.loads(call.function.arguments))
messages.append({
"role": "tool",
"tool_call_id": call.id,
"content": result,
})
Никаких прокси-обёрток и отдельных клиентских библиотек — тот же openai.OpenAI, только base_url другой. Если у вас уже есть код на OpenAI SDK, миграция на Opus 4.7 — это правка двух строк.
Opus 4.7 vs Sonnet 4.6 vs GPT-5.5: когда что брать
Главный практический вопрос — не «какая модель лучшая вообще», а «какую брать под конкретную задачу с учётом цены». Сведём три флагмана в одну таблицу. Цены — из нашего каталога (USD = официальный прайс провайдера, ₽ = по курсу ЦБ 71,668, округление до 10 ₽ вниз).
| Параметр | Claude Opus 4.7 | Claude Sonnet 4.6 | GPT-5.5 |
|---|---|---|---|
| Input, $/1M | $5,00 | $3,00 | $5,00 |
| Output, $/1M | $25,00 | $15,00 | $30,00 |
| Input, ₽/1M | 350 ₽ | 210 ₽ | 350 ₽ |
| Output, ₽/1M | 1790 ₽ | 1070 ₽ | 2150 ₽ |
| Контекст | 1M | 1M | 1,05M |
| Макс. ответ | 128K | 128K | 128K |
| Профиль | сложный код, агенты, reasoning | универсал, баланс цена/качество | reasoning + multimodal |
| Нюанс цены | новый токенайзер: до +35% токенов | стандартный токенайзер | вход >272K = ×2 / выход ×1,5 |
Как это читать:
Opus 4.7 берут, когда:
- задача достаточно сложная, чтобы Sonnet начал ошибаться (нетривиальная отладка, крупный рефакторинг, многошаговое планирование);
- агентный цикл длинный (10–30+ шагов) и важна стабильность между итерациями;
- цена ошибки выше цены токенов — например, генерация кода, который пойдёт в продакшен.
Sonnet 4.6 берут в подавляющем большинстве задач: он дешевле Opus примерно в 1,7 раза по обоим направлениям (210/1070 против 350/1790 ₽) и закрывает типовой код, чат, RAG и агентов средней сложности. Если сомневаетесь — начинайте с Sonnet и поднимайтесь до Opus только там, где видите, что среднего класса не хватает. Детальный разбор Sonnet с кодом и расчётами — в отдельном гайде «Claude Sonnet API за рубли».
GPT-5.5 берут, когда нужен альтернативный флагман — для cross-проверки, для multimodal-сценариев или просто потому, что часть стека уже на OpenAI. По цене Opus 4.7 и GPT-5.5 близки на входе (оба 350 ₽), но GPT-5.5 дороже на выходе (2150 против 1790 ₽). У GPT-5.5 свой нюанс цены: при входе свыше 272K токенов вся сессия пересчитывается по удвоенной входной и полуторной выходной ставке — это съедает экономию на очень длинных контекстах.
Практичный приём: держите все три модели за одним endpoint и маршрутизируйте по типу задачи. Через OpenAI-совместимый интерфейс это просто словарь:
def pick_model(task: str) -> str:
return {
"hard_code": "claude-opus-4-7", # сложный код, агенты
"long_reason": "claude-opus-4-7", # многошаговое рассуждение
"general": "claude-sonnet-4-6", # типовые задачи — дешевле
"cross_check": "gpt-5-5", # альтернативный флагман
}.get(task, "claude-sonnet-4-6") # дефолт — Sonnet, не Opus
resp = client.chat.completions.create(
model=pick_model("general"),
messages=[{"role": "user", "content": "..."}],
)
Дефолт здесь намеренно claude-sonnet-4-6, а не Opus: переключаться на флагман нужно осознанно, под конкретный класс задач, а не «на всякий случай».

Контекст 1M и лимиты: что важно на практике
Окно в 1M токенов выглядит как «можно засунуть что угодно», но у этого есть практические грани.
Сколько это реально. 1M токенов — это порядка 60–80K строк кода или несколько сотен страниц текста. Типовой монорепозиторий среднего сервиса влезает целиком. Но помните про токенайзер: на Opus 4.7 ваш код займёт больше токенов, чем заняла бы та же кодовая база на старых моделях, так что фактическое наполнение окна стоит проверять по usage, а не по «на глаз».
Стоимость заполнения окна. Залить в Opus 4.7 полный миллион входных токенов — это 350 ₽ за один запрос только на вход (и больше с учётом токенайзера). Для разовых архитектурных разборов это копейки; для высокочастотного продакшена с длинным контекстом в каждом запросе — статья расходов, которую надо считать заранее.
Максимальный ответ — 128K. Модель может выдать очень длинный артефакт, но если вы упёрлись в потолок, ответ обрежется. Для больших генераций (многофайловые патчи, длинные документы) ставьте разумный max_tokens и при необходимости продолжайте генерацию вторым запросом.
Кэширование. Для итеративной работы по одному большому контексту (например, серия вопросов по тому же репозиторию в течение часа) используйте prompt caching — кэшированный вход тарифицируется значительно дешевле обычного. Это снимает основную статью расходов на длинном контексте, когда вы гоняете один и тот же массив данных несколько раз подряд.
Оплата на юр.лицо и закрывающие документы
Самый частый вопрос от B2B-команд — не про токены, а про бухгалтерию. Прямой путь к Anthropic из России упирается в то, что карта не принимается, а платёж в адрес иностранной компании без правильно оформленных документов не списывается в расходы и создаёт вопросы при налоговой проверке.
Через Promptra схема выглядит штатно:
- Договор-оферта — публичный, на сайте.
- Счёт на оплату — по запросу из дашборда (название юрлица, ИНН, КПП).
- Акт, счёт-фактура, УПД — формируются по факту оказания услуг.
- ЭДО (Диадок, СБИС, Контур) — подключаем по запросу.
Юрлицо-исполнитель — российское юр.лицо, резидент РФ. Оплата идёт обычной рублёвой платёжкой с расчётного счёта: это договор с российским контрагентом, валютный контроль для него не требуется. Расходы на API корректно ложатся в учёт целиком, с полным пакетом первички через ЭДО.
Отдельно про НДС как общее понятие: когда вы оплачиваете услугу российскому юрлицу и получаете УПД, входящий НДС в этом документе можно принять к вычету в порядке, предусмотренном НК РФ (если вы плательщик НДС). Это та самая причина, по которой закрывающие документы — не формальность, а реальные деньги. Подробный разбор правовой стороны работы с зарубежными LLM на юр.лицо — в статье «Легально ли использовать OpenAI/Claude на юрлицо в РФ».
Promptra — Russian LLM API aggregator. One OpenAI-compatible endpoint to all flagship models: OpenAI (GPT-5.5, GPT-5.4), Anthropic (Claude Opus 4.7, Sonnet 4.6), Google (Gemini 3.1 Pro, 3.5 Flash), DeepSeek V4 Pro, Qwen 3.6 Plus.
Provider prices 1-to-1 at CBR rate — no markup on tokens. Ruble billing per contract, full closing documents through EDI. No VPN — legal B2B service in Russia.
Try: promptra.ru · model catalog · docs




Top comments (0)