DEV Community

Promptra Team for Promptra

Posted on

GPT-5.5 API за рубли: цена, лимиты, подключение

Схема потока запроса к GPT-5.5: запрос разработчика проходит через единый шлюз и распределяется по веткам контекстного окна разной ширины, основная ветка выделена терракотовым цветом

GPT-5.5 — флагманская модель OpenAI, выпущенная 24 апреля 2026 года. Через Promptra она стоит 350 ₽ за 1M входных токенов и 2150 ₽ за 1M выходных — это цена 1-в-1 с прайсом OpenAI ($5 и $30 соответственно) по курсу ЦБ РФ на 27.05.2026 (71.668 ₽/$), без наценки на токены. Контекстное окно — 1 050 000 токенов, максимум на выход — 128 000 токенов. Подключение занимает пять минут: в коде на OpenAI SDK меняется один параметр base_url на https://api.promptra.ru/v1, остальной код остаётся прежним. Оплата идёт на российское юр.лицо с полным пакетом закрывающих документов через ЭДО.

Главный нюанс, который ломает бюджеты на длинных запросах: при входном контексте свыше 272K токенов OpenAI переключает тарификацию на повышенную — 2× за вход и 1.5× за выход на всю сессию. Это не «доплата за лишние токены сверх порога», а смена ставки для всего запроса целиком. Ниже разберём, что это значит на цифрах, когда GPT-5.5 окупается против GPT-5.4 и Claude Opus 4.7, и как подключить модель из России без VPN. Все цены — на 2026-05-28.

Что такое GPT-5.5 и для каких задач

GPT-5.5 — топовая reasoning-модель в линейке OpenAI на конец мая 2026. Это не «чат-модель с улучшениями», а флагман, который OpenAI позиционирует под задачи, где цена ошибки высока: сложный код с длинной цепочкой зависимостей, агентные пайплайны с многошаговым планированием, анализ больших документов, мультимодальные сценарии (на вход принимаются текст и изображения). Подробнее — миграция с OpenAI SDK на Promptra за 10 минут.

В практическом смысле GPT-5.5 — это модель, к которой имеет смысл обращаться, когда более дешёвый GPT-5.4 начинает «срываться»: путает требования в длинном ТЗ, теряет нить в многофайловом рефакторинге, выдаёт правдоподобный, но неверный ответ на вопрос, требующий многошагового рассуждения. На простых задачах — классификация, извлечение полей, короткие ответы FAQ-бота — разница между 5.5 и 5.4 в качестве почти не видна, а в счёте видна сразу: выход GPT-5.5 вдвое дороже.

Ключевые технические характеристики из нашего каталога:

Параметр Значение
Идентификатор модели gpt-5.5
Провайдер OpenAI
Дата релиза 24 апреля 2026
Контекстное окно 1 050 000 токенов
Максимум на выход 128 000 токенов
Модальности входа текст, изображения
Модальности выхода текст
Endpoints chat, responses

Миллион токенов контекста — это ориентировочно 700–750 тысяч слов русского текста или примерно 50 000 строк кода. На практике в одно окно влезает кодовая база среднего сервиса целиком, годовой архив переписки или несколько объёмных PDF-договоров. Но, как мы увидим в разделе про тарификацию, «влезает» и «выгодно обрабатывать целиком» — это разные вещи.

Сравнение масштаба контекстного окна: горизонтальная шкала с вложенными прямоугольниками от маленького к большому, где самый широкий блок обозначает миллион токенов и доминирует над остальными, тёплая бежевая палитра с терракотовым акцентом на крупнейшем блоке

Цена GPT-5.5 в рублях: полная таблица

Promptra не накручивает наценку на токены. Стоимость модели равна официальному прайсу OpenAI, пересчитанному в рубли по курсу ЦБ РФ. Сервисная комиссия 5% берётся только при пополнении баланса, а не с каждого запроса, поэтому в расчётах за токены её нет. Базовый прайс OpenAI публикуется на странице моделей OpenAI и общем прайс-листе.

Тип токенов Цена OpenAI (USD за 1M) Цена Promptra (₽ за 1M)
Вход (input) $5.00 350 ₽
Выход (output) $30.00 2150 ₽

Курс пересчёта: 1 USD = 71.668 ₽ (ЦБ РФ на 27.05.2026). Точная арифметика: $5 × 71.668 = 358.34 ₽, $30 × 71.668 = 2150.04 ₽. В каталоге значения округлены до 350 и 2150 ₽ — фактический счёт считается по курсу ЦБ на день пополнения, поэтому в разные дни рублёвая цифра слегка плавает вслед за курсом, а долларовая ставка остаётся фиксированной.

Чтобы понимать порядок расходов, прикинем стоимость типовых сценариев. Соотношение вход/выход в реальной нагрузке обычно смещено в сторону входа (длинный промпт + контекст, короткий ответ), но в reasoning-задачах выход раздувается за счёт «размышлений» модели.

Сценарий Вход Выход Стоимость
Короткий чат-запрос 1K 0.5K ≈ 1.4 ₽
Анализ документа на 50 страниц 40K 4K ≈ 22.6 ₽
Reasoning-задача с длинным выводом 10K 30K ≈ 68 ₽
RAG-ответ по базе знаний 80K 2K ≈ 32 ₽

Цифры приблизительные и зависят от точного количества токенов в ваших данных. Считаются они просто: (входные_токены / 1 000 000 × 350) + (выходные_токены / 1 000 000 × 2150). Реальный расход всегда видно в дашборде по факту запроса, а оценить заранее можно через официальный токенайзер OpenAI — он показывает, на сколько токенов разобьётся конкретный текст.

Нюанс тарификации свыше 272K: как не сжечь бюджет

Это самый важный раздел статьи, потому что именно здесь чаще всего «прилетает» неожиданный счёт. OpenAI указывает в pricing-документации для GPT-5.5 правило: если входной контекст запроса превышает 272 000 токенов, тарификация всей сессии переключается на повышенную ставку — 2× за вход и 1.5× за выход.

Критичный момент: это не «доплата за токены сверх порога». Это смена ставки для всего запроса целиком. Если вы отправили 280K входных токенов, по двойной ставке оплачиваются все 280K, а не только 8K, которые превысили лимит. И выход этого же запроса считается по ставке 1.5×, даже если на выход пришлась пара тысяч токенов.

Посчитаем разницу в рублях:

Режим Вход (₽ за 1M) Выход (₽ за 1M)
Обычный (вход до 272K) 350 ₽ 2150 ₽
Повышенный (вход свыше 272K) 700 ₽ 3225 ₽

Повышенные ставки — это $10/1M на вход ($5 × 2) и $45/1M на выход ($30 × 1.5), в рублях по курсу ЦБ примерно 700 и 3225 ₽. Иными словами, как только запрос пересекает порог 272K на входе, каждый его токен дорожает: входной вдвое, выходной в полтора раза.

Покажем на конкретном примере, насколько обиден этот «прыжок через порог». Возьмём два почти одинаковых запроса:

Запрос Вход Выход Ставка входа Ставка выхода Стоимость
A — под порогом 270K 5K 350 ₽ 2150 ₽ ≈ 105.3 ₽
B — над порогом 275K 5K 700 ₽ 3225 ₽ ≈ 208.6 ₽

Разница во входных токенах между запросами — всего 5 тысяч (меньше 2%), а счёт почти удвоился: со 105 до 209 ₽. Причина — переход всего запроса на повышенный тариф.

Диаграмма скачкообразного роста стоимости: пологая линия затрат резко перескакивает на верхний уровень при пересечении вертикальной отметки порога, ниже порога зона спокойного бежевого цвета, выше — терракотовая зона удвоенной ставки

Как бюджетировать запросы с длинным контекстом

Из этого правила следует несколько практических выводов для тех, кто работает с большими документами или объёмными кодовыми базами:

Держите вход под 272K, если это возможно. Часто полный контекст не нужен: вместо того чтобы отправлять всю кодовую базу, отправьте только релевантные файлы. Вместо целого договора на 400 страниц — раздел, к которому относится вопрос. Грамотный отбор контекста (retrieval) экономит не только токены, но и удерживает запрос в обычной тарифной зоне.

Если вход всё равно большой — считайте по повышенной ставке заранее. Для пайплайнов, где контекст принципиально превышает 272K (анализ длинных юридических документов, обработка больших логов), закладывайте в бюджет ставки 700/3225 ₽ за 1M, а не 350/2150 ₽. Иначе фактический счёт окажется вдвое выше плановых ожиданий.

Разбивайте задачу на части. Два запроса по 200K входных токенов каждый обойдутся в обычную ставку (350 ₽/1M), а один запрос на 400K — в повышенную (700 ₽/1M). При прочих равных два запроса под порогом дешевле одного над порогом примерно вдвое по входу. Это не всегда применимо (если задача требует всего контекста сразу для связности), но там, где документы можно обрабатывать секциями, экономия существенная.

Используйте prompt caching на повторяющемся контексте. Если один и тот же большой блок (системный промпт, справочник, кодовая база) переиспользуется между запросами, кэширование снижает стоимость его повторной отправки. Это отдельная тема, но именно на длинных контекстах эффект максимальный.

Как подключить GPT-5.5 из России: drop-in через OpenAI SDK

Технически GPT-5.5 через Promptra подключается так же, как напрямую через OpenAI — потому что API совместим с OpenAI на уровне протокола. Меняется ровно один параметр: base_url. Ключ OpenAI заменяется на ключ Promptra, всё остальное в коде остаётся прежним.

Python

from openai import OpenAI

client = OpenAI(
 api_key="prm-xxxxxxxxxxxx", # ключ Promptra
 base_url="https://api.promptra.ru/v1", # единственное изменение
)

response = client.chat.completions.create(
 model="gpt-5.5",
 messages=[
 {"role": "system", "content": "Ты — ассистент инженера."},
 {"role": "user", "content": "Объясни разницу между mutex и semaphore."},
 ],
)

print(response.choices[0].message.content)
Enter fullscreen mode Exit fullscreen mode

Node.js

import OpenAI from "openai";

const client = new OpenAI({
 apiKey: "prm-xxxxxxxxxxxx",
 baseURL: "https://api.promptra.ru/v1", // единственное изменение
});

const response = await client.chat.completions.create({
 model: "gpt-5.5",
 messages: [
 { role: "system", content: "Ты — ассистент инженера." },
 { role: "user", content: "Объясни разницу между mutex и semaphore." },
 ],
});

console.log(response.choices[0].message.content);
Enter fullscreen mode Exit fullscreen mode

Хорошая практика: base_url в переменной окружения

Чтобы не зашивать endpoint в код и иметь возможность переключиться за секунды, держите base_url и ключ в .env:

import os
from openai import OpenAI

# В.env:
# OPENAI_API_KEY=prm-xxxxxxxxxxxx
# OPENAI_BASE_URL=https://api.promptra.ru/v1

client = OpenAI(
 api_key=os.environ["OPENAI_API_KEY"],
 base_url=os.environ["OPENAI_BASE_URL"],
)

response = client.chat.completions.create(
 model="gpt-5.5",
 messages=[{"role": "user", "content": "Привет"}],
)
Enter fullscreen mode Exit fullscreen mode

Проверить, что подключение работает, можно одним curl-запросом без всякого SDK:

curl https://api.promptra.ru/v1/chat/completions \
 -H "Authorization: Bearer prm-xxxxxxxxxxxx" \
 -H "Content-Type: application/json" \
 -d '{
 "model": "gpt-5.5",
 "messages": [{"role": "user", "content": "ping"}]
 }'
Enter fullscreen mode Exit fullscreen mode

Если в ответ пришёл JSON с полем choices — модель отвечает, можно подключать в продакшен. Почему этот путь надёжнее прямого доступа через VPN и виртуальные карты — мы подробно разобрали в отдельном гайде про OpenAI API в России: там и про блокировки аккаунтов, и про риски карт, и про юридическую сторону.

Сравнение двух интеграционных путей в виде диаграммы «было/стало»: слева ломаная нестабильная линия с разрывами через значок облака и замка, справа прямая непрерывная линия через единый шлюз к стопке моделей, правый путь подсвечен терракотой

GPT-5.5 vs GPT-5.4 vs GPT-5.4 mini: когда что выбирать

Самый частый практический вопрос — не «какая модель лучшая», а «какая модель достаточна для моей задачи при минимальной цене». В линейке OpenAI на конец мая 2026 три рабочие точки: флагман 5.5, универсал 5.4 и бюджетный 5.4 mini. Сведём их в таблицу (цены — из нашего каталога, 1-в-1 с прайсом OpenAI по курсу ЦБ).

Модель Вход (₽/1M) Выход (₽/1M) Контекст Макс. выход Роль
GPT-5.5 350 ₽ 2150 ₽ 1.05M 128K Флагман: сложный reasoning, агенты
GPT-5.4 170 ₽ 1070 ₽ 1.05M 128K Универсал: chat, общие задачи
GPT-5.4 mini 50 ₽ 320 ₽ 400K 128K Массовые запросы, автоматизация

USD-прайс для справки: GPT-5.5 — $5/$30, GPT-5.4 — $2.5/$15, GPT-5.4 mini — $0.75/$4.5 (источник — прайс-лист OpenAI).

Цифры показывают разрыв наглядно. Выход GPT-5.5 ровно вдвое дороже GPT-5.4 и примерно в 6.7 раза дороже GPT-5.4 mini. На больших объёмах эта разница превращается в десятки и сотни тысяч рублей в месяц.

Берите GPT-5.5, когда: задача требует глубокого многошагового рассуждения, и цена ошибки выше цены токенов. Сложный код с длинными зависимостями, агентные пайплайны с планированием, анализ, где модель должна удерживать в голове много условий одновременно. Если вы заметили, что 5.4 систематически ошибается на вашем классе задач — это сигнал поднять модель.

Берите GPT-5.4, когда: нужен крепкий универсал для большинства задач — генерация и рефакторинг кода средней сложности, развёрнутые ответы, работа с документами, чат-ассистенты для сотрудников. Это «рабочая лошадка», которая закрывает 80% сценариев за половину цены флагмана. Подробный разбор GPT-5.4 будет в отдельной статье про GPT-5.4 API за рубли.

Берите GPT-5.4 mini, когда: объём запросов большой, а каждая задача простая — классификация, извлечение полей, модерация, короткие ответы, обработка очередей. На потоке в миллионы запросов экономия против флагмана драматична: выход дешевле в 6.7 раза. Обратите внимание: у mini контекст 400K, а не 1.05M — для большинства массовых задач этого с запасом, но для обработки очень длинных документов потребуется старшая модель.

Дерево решения выбора модели OpenAI: от корневого вопроса о сложности задачи ветви расходятся к трём блокам разного размера — крупный для флагмана, средний для универсала, компактный для mini, каждый блок своего оттенка тёплой палитры

GPT-5.5 vs Claude Opus 4.7: флагман против флагмана

Если GPT-5.5 — вершина линейки OpenAI, то её естественный конкурент — Claude Opus 4.7 от Anthropic, флагман в своей линейке. Обе модели нацелены на одни и те же задачи: сложный код, агенты, длинный reasoning. Сравним по цене и характеристикам.

Параметр GPT-5.5 Claude Opus 4.7
Вход (₽/1M) 350 ₽ 350 ₽
Выход (₽/1M) 2150 ₽ 1790 ₽
Вход (USD/1M) $5.00 $5.00
Выход (USD/1M) $30.00 $25.00
Контекст 1.05M 1M
Макс. выход 128K 128K
Особенность тарификации вход свыше 272K → 2×/1.5× новый токенайзер: до +35% токенов

Входная ставка у моделей одинаковая — $5 за 1M. На выходе Claude Opus 4.7 номинально дешевле: 1790 ₽ против 2150 ₽ (на 17% меньше). Но есть два подводных камня, которые делают прямое сравнение «по ставке» обманчивым.

У GPT-5.5 — порог 272K. На запросах с длинным входным контекстом GPT-5.5 переключается на удвоенную ставку, как мы разобрали выше. Claude Opus 4.7 такого скачка не имеет — ставка ровная на всём контексте до 1M. Поэтому на больших входных контекстах Opus 4.7 может оказаться существенно дешевле, несмотря на близкие номинальные цены.

У Claude Opus 4.7 — новый токенайзер. Anthropic в своей pricing-документации предупреждает: Opus 4.7 использует новый токенайзер, который на одном и том же тексте может разбивать его на до 35% больше токенов. То есть номинально более низкая ставка частично съедается тем, что тех же символов получается больше токенов. На русском тексте, который и так токенизируется менее эффективно, чем английский, этот эффект особенно заметен.

Вывод по выбору: на коротких и средних входных контекстах разница между моделями определяется не столько ставкой, сколько тем, как каждая токенизирует именно ваш текст и как справляется с вашим классом задач. На длинных входных контекстах (ближе к сотням тысяч токенов) у GPT-5.5 включается порог 272K, и здесь Claude Opus 4.7 с ровной ставкой может выиграть по деньгам. Практический совет — прогнать обе модели на репрезентативной выборке ваших реальных запросов и сравнить и качество, и фактический счёт. Развёрнутое сравнение всех флагманов мы собрали в обзоре топ-5 LLM 2026.

Лимиты, контекст и максимальный выход

Помимо цены, у GPT-5.5 есть архитектурные лимиты, которые важно учитывать при проектировании:

  • Контекстное окно — 1 050 000 токенов. Это суммарный объём «вход + всё, что модель удерживает в рамках запроса». На практике это позволяет загрузить очень крупный объём данных за один вызов — но помните про порог тарификации 272K на входе.
  • Максимум на выход — 128 000 токенов. Сколько модель может сгенерировать в одном ответе. 128K выходных токенов — это примерно 90–100 тысяч слов, объём небольшой книги. Для подавляющего большинства задач этого с огромным запасом, но если вы генерируете очень длинные структурированные документы, держите лимит в голове.
  • Входные модальности — текст и изображения. GPT-5.5 принимает на вход не только текст, но и изображения (например, скриншоты интерфейсов, диаграммы, фотографии документов). Выход — только текст.
  • Endpoints — chat и responses. Модель доступна через стандартный chat-completions API (совместимый с OpenAI SDK, как в примерах выше) и через responses API.

Если у вас задача упирается в лимит выхода (нужно сгенерировать документ длиннее 128K токенов) — стандартное решение — разбивать генерацию на части с продолжением контекста, а не пытаться выжать всё в один вызов.

Сколько стоит GPT-5.5 в месяц: прикидка для команды

Чтобы цена в ₽ за миллион токенов превратилась в понятную цифру месячного бюджета, прикинем три профиля нагрузки. Допущения указаны рядом — подставьте свои.

Профиль Запросов/мес Средний вход Средний выход Токенов вход/мес Токенов выход/мес Стоимость/мес
Небольшой продукт 50 000 3K 1K 150M 50M ≈ 160 000 ₽
Средняя нагрузка 300 000 5K 1.5K 1.5B 450M ≈ 1 492 500 ₽
Reasoning-пайплайн 30 000 8K 8K 240M 240M ≈ 600 000 ₽

Расчёт прямой: входные токены за месяц делим на миллион и умножаем на 350 ₽, выходные — на 2150 ₽, складываем. Например, для «небольшого продукта»: 150 × 350 + 50 × 2150 = 52 500 + 107 500 = 160 000 ₽.

Видно, что в reasoning-задачах с большим выходом основной счёт формирует именно output (он дороже входа в 6 с лишним раз). Это ещё один аргумент думать над выбором модели: если на части ваших запросов хватит GPT-5.4, перенос их с 5.5 на 5.4 режет стоимость выхода ровно вдвое. Многие команды строят гибридную схему: дешёвая модель на потоке, флагман — только на запросах, где она реально нужна. Сервисная комиссия Promptra (5%) при этом берётся один раз при пополнении баланса, а не с каждого из этих запросов.

Оплата и документы для юр.лица

Стоимость GPT-5.5 vs альтернатив на одном профиле

Модель Вход ₽/1M Выход ₽/1M Стоимость 1 типового запроса (5K+1.5K) На 100K запросов/мес
GPT-5.5 350 2150 4.98 ₽ 498 000 ₽
Claude Opus 4.7 350 1790 4.44 ₽ 444 000 ₽
GPT-5.4 170 1070 2.46 ₽ 246 000 ₽
Claude Sonnet 4.6 210 1070 2.66 ₽ 266 000 ₽
Gemini 3.1 Pro 140 860 1.99 ₽ 199 000 ₽
DeepSeek V4 Pro (промо) 30 60 0.24 ₽ 24 000 ₽

Если задача терпит универсал, переход с GPT-5.5 на GPT-5.4 экономит 252 000 ₽ в месяц при том же объёме — и почти всегда без потери качества на типовых сценариях.

Для команд в компаниях важна не только цена токена, но и то, как эти расходы проходят по бухгалтерии. Promptra принимает оплату на российское юр.лицо — российское юр.лицо — с полным пакетом закрывающих документов: договор-оферта, счёт, акт, счёт-фактура, УПД. Документооборот идёт через ЭДО (Диадок, СБИС), что удобно для корпоративной бухгалтерии — документы автоматически проводятся в учётной системе.

Это принципиальное отличие от прямого доступа к OpenAI через VPN и виртуальные карты: при таком сценарии у вас на руках нет закрывающих документов российского формата, расход сложно корректно учесть, а аккаунт живёт до первого бана. Расходы на API без правильно оформленной первички не принимаются к учёту бизнеса. Подробно юридическую и бухгалтерскую сторону мы разобрали в гайде про OpenAI API в России — там и про оферту OpenAI, и про то, как расходы корректно ложатся в учёт компании.


Promptra — Russian LLM API aggregator. One OpenAI-compatible endpoint to all flagship models: OpenAI (GPT-5.5, GPT-5.4), Anthropic (Claude Opus 4.7, Sonnet 4.6), Google (Gemini 3.1 Pro, 3.5 Flash), DeepSeek V4 Pro, Qwen 3.6 Plus.

Provider prices 1-to-1 at CBR rate — no markup on tokens. Ruble billing per contract, full closing documents through EDI. No VPN — legal B2B service in Russia.

Try: promptra.ru · model catalog · docs

Top comments (0)