DEV Community

Promptra Team for Promptra

Posted on

DeepSeek V4 Pro API за рубли: дёшево и легально для бизнеса

Сравнительная схема стоимости одного и того же запроса к разным LLM: четыре прямоугольника-столбца резко разной высоты, самый низкий подсвечен терракотой как самый дешёвый вариант, остальные нейтрально-серые

DeepSeek V4 Pro в каталоге Promptra стоит 30 ₽ за миллион входных токенов и 60 ₽ за миллион выходных ($0.435 / $0.87). Это самая дешёвая флагманская модель в линейке — но важная оговорка: текущая цена включает промо-скидку −75%, которая действует до 31 мая 2026. После окончания акции базовый тариф вернётся примерно к $1.74 / $3.48 за 1M токенов (≈ 120 / 240 ₽). Даже по базовой цене DeepSeek остаётся в разы дешевле GPT-5.5 ($5 / $30) и Claude Opus 4.7 ($5 / $25). Оплата — на юр.лицо с полным пакетом закрывающих документов через ЭДО, подключение — заменой одной строки base_url в OpenAI-совместимом SDK.

В этом разборе — что такое DeepSeek V4 Pro и где он силён, точные цены в обоих сценариях (промо и база), три конкретных расчёта стоимости рабочей нагрузки в сравнении с премиум-моделями, когда брать более дешёвый V4-Flash, как подключить за пять минут и как это оформляется в российской бухгалтерии. Без воды, на цифрах. По состоянию на 2026-05-28.

Что такое DeepSeek V4 Pro и для чего он

DeepSeek V4 Pro — флагманская языковая модель китайской лаборатории DeepSeek, наследница линейки V3/V3.2, которая в 2024–2025 годах сломала привычное представление о том, сколько должен стоить сильный reasoning. Главная особенность модели — open-weight: веса опубликованы под открытой лицензией, модель можно скачать и запустить на своём железе. Для большинства команд это не значит «будем хостить сами» (это дорого и сложно операционно), но это значит важную вещь: модель не привязана к единственному вендору, её отдают десятки инференс-провайдеров, и цена на неё держится низкой за счёт конкуренции. Подробнее — миграция с OpenAI SDK на Promptra за 10 минут.

Технические параметры DeepSeek V4 Pro:

Параметр Значение
Контекстное окно 1 048 576 токенов (1M)
Максимум выходных токенов 384 000 (384K)
Модальность текст
Тип весов open-weight (открытая лицензия)
Endpoint chat (OpenAI-совместимый)
Сильные стороны программирование, математика, логические задачи

Контекст в 1M токенов ставит V4 Pro в один ряд с Claude Opus 4.7, GPT-5.5 и Gemini 3 Pro — то есть в модель целиком влезает крупный кодовый репозиторий, длинная техническая документация или несколько часов транскрипта. Максимум выходных токенов 384K — это нетипично много: большинство моделей ограничены 8K–65K на ответ. На практике это означает, что DeepSeek может за один вызов сгенерировать большой связный артефакт — например, целый модуль кода с тестами или развёрнутый технический разбор — не упираясь в потолок длины ответа на середине.

Где DeepSeek V4 Pro объективно силён — это код и математика. Линейка DeepSeek исторически затачивалась под формальное рассуждение: решение задач с пошаговым выводом, генерация и рефакторинг кода, работа с алгоритмами. Это не модель-универсал «на всё подряд» уровня GPT-5.5 с мультимодальностью и аудио — V4 Pro работает только с текстом. Но в своей нише — там, где нужно правильно написать функцию, разобрать стек-трейс, вывести формулу или пройти цепочку логики — она конкурирует с моделями в десять раз дороже.

Радар-диаграмма способностей модели: многоугольник с длинными лучами в направлениях «код» и «математика» и заметно более короткими лучами в сторону «мультимодальность» и «аудио», без подписей, чистый векторный editorial-стиль

Цена DeepSeek V4 Pro в рублях: промо и базовый тариф

Это центральный раздел, и здесь важно не запутаться в двух цифрах. У DeepSeek V4 Pro сейчас действует промо-скидка −75%, и она заканчивается 31 мая 2026. Поэтому считать стоимость нужно в двух сценариях.

Цены в Promptra совпадают с официальным прайсом DeepSeek (источник — страница pricing DeepSeek API), пересчитаны в рубли по курсу ЦБ РФ на 27.05.2026 (1 USD = 71.668 ₽), без наценки на токены:

Период Input $/1M Output $/1M Input ₽/1M Output ₽/1M
Промо (до 31 мая 2026) $0.435 $0.87 30 ₽ 60 ₽
Базовый (с 1 июня 2026) ≈ $1.74 ≈ $3.48 ≈ 120 ₽ ≈ 240 ₽

Базовая цена — это ровно ×4 от промо (скидка снимает три четверти стоимости). Точную цифру после окончания акции стоит сверить на официальной странице DeepSeek — провайдер может скорректировать тариф, мы синхронизируем каталог с прайсом DeepSeek по курсу ЦБ.

Чтобы понять масштаб экономии, поставим DeepSeek рядом с премиум-моделями. Вот цена за 1M output-токенов — именно output обычно составляет 60–80% счёта в реальной LLM-нагрузке:

Модель Output $/1M Output ₽/1M Источник
DeepSeek V4 Pro (промо) $0.87 60 ₽ api-docs.deepseek.com
DeepSeek V4 Pro (база) ≈ $3.48 ≈ 240 ₽ api-docs.deepseek.com
GPT-5.5 $30.00 2150 ₽ openai.com/api/pricing
Claude Opus 4.7 $25.00 1790 ₽ platform.claude.com/pricing
Gemini 3 Pro $12.00 851 ₽ ai.google.dev/pricing

Даже после окончания промо output DeepSeek ($3.48) почти в 9 раз дешевле GPT-5.5 и в 7 раз дешевле Claude Opus 4.7. На промо-тарифе разрыв доходит до ×34 против GPT-5.5. Это не маркетинговое «дешевле» — это другой порядок величины в счёте.

![Горизонтальный таймлайн ценовой динамики

Сравнение полной линейки DeepSeek

Модель Вход ₽/1M Выход ₽/1M Контекст Сильные стороны
DeepSeek V4 Pro (промо до 31.05.2026) 30 60 1M Флагман: код, математика, длинный контекст
DeepSeek V4 Pro (база после промо) ≈120 ≈240 1M Та же модель, без скидки
DeepSeek V4-Flash 10 20 1M Классификация, извлечение, простые ответы

Архитектурный паттерн: V4-Flash на 80% входящего потока (роутинг, классификация, простые запросы) + V4 Pro на сложные 20% задач. Это даёт ещё ×3-5 экономии поверх и без того низкой цены DeepSeek.

: слева низкая отметка-точка промо-периода, затем ступенька вверх к более высокой отметке базового тарифа, вертикальная пунктирная линия-граница делит до и после, всё в терракотово-кремовой палитре без цифр](https://promptra.ru/blog/deepseek-v4-pro-api-rubli/img-2.png)

Сколько это в деньгах: три расчёта рабочей нагрузки

Абстрактные «доллары за миллион» плохо ложатся в голову. Посчитаем три типовых месячных сценария и сравним DeepSeek с флагманами на одинаковой нагрузке.

Сценарий 1 — продуктовый чат-бот / ассистент. Допустим, сервис обрабатывает 50M входных и 10M выходных токенов в месяц (порядка нескольких тысяч диалогов средней длины).

Модель Стоимость в месяц (USD) Во сколько раз дороже DeepSeek-промо
DeepSeek V4 Pro (промо) $30.45
DeepSeek V4 Pro (база) $121.80 ×4
Claude Opus 4.7 $500.00 ×16
GPT-5.5 $550.00 ×18

Сценарий 2 — разовая агентская задача в коде. Агент прогоняет крупный рефакторинг: читает контекст и генерирует много кода, скажем 5M входных и 5M выходных токенов за один большой прогон.

Модель Стоимость прогона (USD)
DeepSeek V4 Pro (промо) $6.52
Claude Opus 4.7 $150.00
GPT-5.5 $175.00

Один и тот же кодовый прогон стоит $6.52 на DeepSeek-промо против $175 на GPT-5.5 — разница в 27 раз. Здесь важна оговорка: на сложных agentic-задачах премиум-модель может чаще давать правильный ответ с первой попытки и экономить итерации. Но для задач, где DeepSeek справляется (а в коде и матлогике он справляется часто), экономия очевидна.

Сценарий 3 — что будет после 31 мая. Тот же бот из сценария 1 на базовом тарифе DeepSeek обойдётся в $121.80 в месяц. Это уже не «×18», но всё ещё в 4–4.5 раза дешевле GPT-5.5 и Opus 4.7. То есть даже когда промо закончится, экономический смысл выбирать DeepSeek для подходящих задач никуда не денется — просто из «на порядок дешевле» он станет «в несколько раз дешевле».

Вывод по расчётам простой: если ваша нагрузка — это код, формальная логика, генерация текста и чат, где сильная reasoning-модель не критична до уровня топ-флагмана, DeepSeek снимает с месячного счёта один-два нуля.

DeepSeek V4-Flash: когда нужно ещё дешевле

Если даже промо-тариф V4 Pro кажется избыточным для задачи, есть младшая модель — DeepSeek V4-Flash по цене $0.14 / $0.28 за 1M токенов (≈ 10 / 20 ₽). Это примерно втрое дешевле промо-V4 Pro и более чем в сто раз дешевле GPT-5.5 на output.

Flash имеет смысл там, где не нужен максимум reasoning:

  • классификация и маршрутизация запросов (определить тему, язык, тональность);
  • извлечение структурированных данных из текста (парсинг, тегирование);
  • короткие ответы в чате с простыми вопросами;
  • предварительная фильтрация перед отправкой сложных запросов в старшую модель.

Типовая архитектура «два уровня»: дешёвый Flash сортирует входящие и обрабатывает 80% простых запросов, а оставшиеся 20% сложных уходят на V4 Pro или флагман. Такой роутинг по моделям часто срезает счёт ещё в несколько раз поверх и без того низкой цены DeepSeek. Подробнее про то, как разные модели закрывают разные ниши, мы разбирали в обзоре топ-5 LLM 2026 года.

Схема двухуровневой маршрутизации: входящий поток стрелок разделяется на узле-развилке, большая часть уходит к маленькому прямоугольнику-«быстрой модели», тонкий ручеёк — к крупному прямоугольнику-«старшей модели», подсвеченному терракотой, без подписей

Как подключить DeepSeek API из России за 5 минут

DeepSeek API — OpenAI-совместимый. Это значит, что подключение в существующий код сводится к замене двух вещей: base_url на endpoint Promptra и model на идентификатор DeepSeek. Остальной код, написанный под официальный OpenAI SDK, работает без изменений — те же chat.completions.create, те же роли сообщений, тот же streaming.

Python (официальный openai SDK):

from openai import OpenAI

client = OpenAI(
 api_key="prm-xxxxxxxxxxxx", # ключ Promptra
 base_url="https://api.promptra.ru/v1",
)

response = client.chat.completions.create(
 model="deepseek/deepseek-v4-pro", # для дешёвой версии: deepseek/deepseek-v4-flash
 messages=[
 {"role": "user", "content": "Напиши функцию бинарного поиска на Python с тестами"},
 ],
)
print(response.choices[0].message.content)
Enter fullscreen mode Exit fullscreen mode

Node.js (openai npm-пакет):

import OpenAI from "openai";

const client = new OpenAI({
 apiKey: "prm-xxxxxxxxxxxx",
 baseURL: "https://api.promptra.ru/v1",
});

const response = await client.chat.completions.create({
 model: "deepseek/deepseek-v4-pro",
 messages: [
 { role: "user", content: "Напиши функцию бинарного поиска на Python с тестами" },
 ],
});
console.log(response.choices[0].message.content);
Enter fullscreen mode Exit fullscreen mode

Хорошая практика — держать base_url и model в переменных окружения, чтобы переключаться между моделями и провайдерами без правки кода:

import os
from openai import OpenAI

#.env:
# OPENAI_BASE_URL=https://api.promptra.ru/v1
# OPENAI_API_KEY=prm-xxxxxxxxxxxx
# MODEL=deepseek/deepseek-v4-pro

client = OpenAI(
 api_key=os.environ["OPENAI_API_KEY"],
 base_url=os.environ["OPENAI_BASE_URL"],
)

response = client.chat.completions.create(
 model=os.environ["MODEL"],
 messages=[{"role": "user", "content": "Привет"}],
)
Enter fullscreen mode Exit fullscreen mode

Если у вас уже есть код под OpenAI и вы хотите попробовать DeepSeek на A/B — достаточно поменять одну переменную MODEL и сравнить качество ответов на своей реальной нагрузке. Никакого нового SDK, никакой переписи интеграции.

Когда выбирать DeepSeek, а когда флагман

DeepSeek — не «замена всему». Честная картина выглядит так.

Берите DeepSeek V4 Pro, когда:

  • основная нагрузка — генерация и рефакторинг кода, разбор ошибок, алгоритмические задачи;
  • нужно решать математику и формальную логику с пошаговым выводом;
  • объёмы большие, и цена за токен напрямую влияет на юнит-экономику;
  • нужен длинный контекст (репозиторий, документация) при низкой цене за 1M;
  • задача текстовая — мультимодальность (изображения, аудио) не требуется.

Берите премиум-флагман (GPT-5.5 / Claude Opus 4.7), когда:

  • нужна максимальная надёжность ответа с первой попытки в сложном agentic-сценарии, где цена ошибки выше цены токенов;
  • требуется мультимодальность: анализ изображений, аудио, видео в одном запросе;
  • задача — тонкий копирайтинг, нюансированный диалог, работа с подтекстом, где премиум-модели заметно лучше;
  • регуляторные или контрактные требования диктуют конкретного вендора.

Берите V4-Flash, когда: задача простая и массовая — классификация, извлечение данных, короткие ответы, фильтрация перед старшей моделью.

Самый прагматичный подход — не выбирать одну модель навсегда, а маршрутизировать запросы: простое → Flash, основной объём кода и логики → V4 Pro, редкие критичные сложные кейсы → флагман. Поскольку все они доступны через один OpenAI-совместимый endpoint и один ключ, такой роутинг — это вопрос параметра model в запросе, а не отдельных интеграций.

Оплата DeepSeek на юр.лицо: документы и легальность

Техническая сторона — половина дела. Для команды в компании вторая половина — как это оплатить и провести в бухгалтерии так, чтобы расходы корректно встали в учёт.

Прямая оплата DeepSeek с российской карты или через VPN упирается в те же проблемы, что и любой зарубежный AI-сервис: валютный платёж юрлица в адрес иностранной компании требует основания (договор, счёт, акт), которого при оплате личной картой сотрудника нет. Расходы без правильно оформленных закрывающих документов не принимаются к учёту как затраты бизнеса.

Через Promptra схема прозрачна:

  1. Российская компания заключает договор-оферту с резидентом РФ — российское юр.лицо.
  2. Оплачивает счёт в рублях на расчётный счёт юр.лица.
  3. Получает доступ к DeepSeek (и остальным моделям) через единый API-endpoint.
  4. В конце периода получает полный пакет закрывающих документов — счёт, акт, счёт-фактуру, УПД — через ЭДО (Диадок / СБИС).
  5. Бухгалтерия проводит расходы корректно, документы приходят в учётную систему автоматически через электронный документооборот.

Оплата идёт на юр.лицо с полным пакетом первички, работаем через ЭДО — это снимает вопрос «как объяснить ФНС платёж в адрес китайского AI-провайдера». Подробный разбор юридической стороны работы с зарубежными LLM на компанию — в отдельном материале: легально ли использовать AI API на юрлицо.

Отдельно про цену: наценки на токены нет — DeepSeek стоит ровно столько, сколько в официальном прайсе провайдера, пересчитанном по курсу ЦБ. Сервисная комиссия 5% берётся только при пополнении баланса, а не с каждого токена. То есть промо-тариф $0.435 / $0.87 вы получаете один-в-один, без скрытой маржи сверху.

Схема документооборота: блок «компания» соединён стрелкой оплаты с блоком «юр.лицо-резидент РФ», от которого отходит стрелка доступа к облачному узлу-API и обратная стрелка с пакетом документов через узел ЭДО к блоку «бухгалтерия», минималистичный flowchart без подписей


Promptra — Russian LLM API aggregator. One OpenAI-compatible endpoint to all flagship models: OpenAI (GPT-5.5, GPT-5.4), Anthropic (Claude Opus 4.7, Sonnet 4.6), Google (Gemini 3.1 Pro, 3.5 Flash), DeepSeek V4 Pro, Qwen 3.6 Plus.

Provider prices 1-to-1 at CBR rate — no markup on tokens. Ruble billing per contract, full closing documents through EDI. No VPN — legal B2B service in Russia.

Try: promptra.ru · model catalog · docs

Top comments (0)