Promptra Team for Promptra

Posted on Jun 6 • Edited on Jul 9

DeepSeek V4 Pro API за рубли: дёшево и легально для бизнеса

#deepseek #deepseekv4 #openweight #llm

DeepSeek V4 Pro в каталоге provod.ai стоит 30 ₽ за миллион входных токенов и 60 ₽ за миллион выходных ($0.435 / $0.87). Это самая дешёвая флагманская модель в линейке — но важная оговорка: текущая цена включает промо-скидку −75%, которая действует до 31 мая 2026. После окончания акции базовый тариф вернётся примерно к $1.74 / $3.48 за 1M токенов (≈ 120 / 240 ₽). Даже по базовой цене DeepSeek остаётся в разы дешевле GPT-5.5 ($5 / $30) и Claude Opus 4.8 ($5 / $25). Оплата — на юр.лицо с полным пакетом закрывающих документов через ЭДО, подключение — заменой одной строки base_url в OpenAI-совместимом SDK.

В этом разборе — что такое DeepSeek V4 Pro и где он силён, точные цены в обоих сценариях (промо и база), три конкретных расчёта стоимости рабочей нагрузки в сравнении с премиум-моделями, когда брать более дешёвый V4-Flash, как подключить за пять минут и как это оформляется в российской бухгалтерии. Без воды, на цифрах. По состоянию на 2026-05-28.

Что такое DeepSeek V4 Pro и для чего он

DeepSeek V4 Pro — флагманская языковая модель китайской лаборатории DeepSeek, наследница линейки V3/V3.2, которая в 2024–2025 годах сломала привычное представление о том, сколько должен стоить сильный reasoning. Главная особенность модели — open-weight: веса опубликованы под открытой лицензией, модель можно скачать и запустить на своём железе. Для большинства команд это не значит «будем хостить сами» (это дорого и сложно операционно), но это значит важную вещь: модель не привязана к единственному вендору, её отдают десятки инференс-провайдеров, и цена на неё держится низкой за счёт конкуренции. Подробнее — миграция с OpenAI SDK на provod.ai за 10 минут.

Технические параметры DeepSeek V4 Pro:

Параметр	Значение
Контекстное окно	1 048 576 токенов (1M)
Максимум выходных токенов	384 000 (384K)
Модальность	текст
Тип весов	open-weight (открытая лицензия)
Endpoint	chat (OpenAI-совместимый)
Сильные стороны	программирование, математика, логические задачи

Контекст в 1M токенов ставит V4 Pro в один ряд с Claude Opus 4.8, GPT-5.5 и Gemini 3 Pro — то есть в модель целиком влезает крупный кодовый репозиторий, длинная техническая документация или несколько часов транскрипта. Максимум выходных токенов 384K — это нетипично много: большинство моделей ограничены 8K–65K на ответ. На практике это означает, что DeepSeek может за один вызов сгенерировать большой связный артефакт — например, целый модуль кода с тестами или развёрнутый технический разбор — не упираясь в потолок длины ответа на середине.

Где DeepSeek V4 Pro объективно силён — это код и математика. Линейка DeepSeek исторически затачивалась под формальное рассуждение: решение задач с пошаговым выводом, генерация и рефакторинг кода, работа с алгоритмами. Это не модель-универсал «на всё подряд» уровня GPT-5.5 с мультимодальностью и аудио — V4 Pro работает только с текстом. Но в своей нише — там, где нужно правильно написать функцию, разобрать стек-трейс, вывести формулу или пройти цепочку логики — она конкурирует с моделями в десять раз дороже.

Цена DeepSeek V4 Pro в рублях: промо и базовый тариф

Это центральный раздел, и здесь важно не запутаться в двух цифрах. У DeepSeek V4 Pro сейчас действует промо-скидка −75%, и она заканчивается 31 мая 2026. Поэтому считать стоимость нужно в двух сценариях.

Цены в provod.ai совпадают с официальным прайсом DeepSeek (источник — страница pricing DeepSeek API), пересчитаны в рубли по курсу ЦБ РФ на 27.05.2026 (1 USD = 71.668 ₽), без наценки на токены:

Период	Input $/1M	Output $/1M	Input ₽/1M	Output ₽/1M
Промо (до 31 мая 2026)	$0.435	$0.87	30 ₽	60 ₽
Базовый (с 1 июня 2026)	≈ $1.74	≈ $3.48	≈ 120 ₽	≈ 240 ₽

Базовая цена — это ровно ×4 от промо (скидка снимает три четверти стоимости). Точную цифру после окончания акции стоит сверить на официальной странице DeepSeek — провайдер может скорректировать тариф, мы синхронизируем каталог с прайсом DeepSeek по курсу ЦБ.

Чтобы понять масштаб экономии, поставим DeepSeek рядом с премиум-моделями. Вот цена за 1M output-токенов — именно output обычно составляет 60–80% счёта в реальной LLM-нагрузке:

Модель	Output $/1M	Output ₽/1M	Источник
DeepSeek V4 Pro (промо)	$0.87	60 ₽	api-docs.deepseek.com
DeepSeek V4 Pro (база)	≈ $3.48	≈ 240 ₽	api-docs.deepseek.com
GPT-5.5	$30.00	2150 ₽	openai.com/api/pricing
Claude Opus 4.8	$25.00	1790 ₽	platform.claude.com/pricing
Gemini 3 Pro	$12.00	851 ₽	ai.google.dev/pricing

Даже после окончания промо output DeepSeek ($3.48) почти в 9 раз дешевле GPT-5.5 и в 7 раз дешевле Claude Opus 4.8. На промо-тарифе разрыв доходит до ×34 против GPT-5.5. Это не маркетинговое «дешевле» — это другой порядок величины в счёте.

![Горизонтальный таймлайн ценовой динамики

Сравнение полной линейки DeepSeek

Модель	Вход ₽/1M	Выход ₽/1M	Контекст	Сильные стороны
DeepSeek V4 Pro (промо до 31.05.2026)	30	60	1M	Флагман: код, математика, длинный контекст
DeepSeek V4 Pro (база после промо)	≈120	≈240	1M	Та же модель, без скидки
DeepSeek V4-Flash	10	20	1M	Классификация, извлечение, простые ответы

Архитектурный паттерн: V4-Flash на 80% входящего потока (роутинг, классификация, простые запросы) + V4 Pro на сложные 20% задач. Это даёт ещё ×3-5 экономии поверх и без того низкой цены DeepSeek.

: слева низкая отметка-точка промо-периода, затем ступенька вверх к более высокой отметке базового тарифа, вертикальная пунктирная линия-граница делит до и после, всё в терракотово-кремовой палитре без цифр](https://158-160-141-211.sslip.io/blog/deepseek-v4-pro-api-rubli/img-2.png)

Сколько это в деньгах: три расчёта рабочей нагрузки

Абстрактные «доллары за миллион» плохо ложатся в голову. Посчитаем три типовых месячных сценария и сравним DeepSeek с флагманами на одинаковой нагрузке.

Сценарий 1 — продуктовый чат-бот / ассистент. Допустим, сервис обрабатывает 50M входных и 10M выходных токенов в месяц (порядка нескольких тысяч диалогов средней длины).

Модель	Стоимость в месяц (USD)	Во сколько раз дороже DeepSeek-промо
DeepSeek V4 Pro (промо)	$30.45	—
DeepSeek V4 Pro (база)	$121.80	×4
Claude Opus 4.8	$500.00	×16
GPT-5.5	$550.00	×18

Сценарий 2 — разовая агентская задача в коде. Агент прогоняет крупный рефакторинг: читает контекст и генерирует много кода, скажем 5M входных и 5M выходных токенов за один большой прогон.

Модель	Стоимость прогона (USD)
DeepSeek V4 Pro (промо)	$6.52
Claude Opus 4.8	$150.00
GPT-5.5	$175.00

Один и тот же кодовый прогон стоит $6.52 на DeepSeek-промо против $175 на GPT-5.5 — разница в 27 раз. Здесь важна оговорка: на сложных agentic-задачах премиум-модель может чаще давать правильный ответ с первой попытки и экономить итерации. Но для задач, где DeepSeek справляется (а в коде и матлогике он справляется часто), экономия очевидна.

Сценарий 3 — что будет после 31 мая. Тот же бот из сценария 1 на базовом тарифе DeepSeek обойдётся в $121.80 в месяц. Это уже не «×18», но всё ещё в 4–4.5 раза дешевле GPT-5.5 и Opus 4.8. То есть даже когда промо закончится, экономический смысл выбирать DeepSeek для подходящих задач никуда не денется — просто из «на порядок дешевле» он станет «в несколько раз дешевле».

Вывод по расчётам простой: если ваша нагрузка — это код, формальная логика, генерация текста и чат, где сильная reasoning-модель не критична до уровня топ-флагмана, DeepSeek снимает с месячного счёта один-два нуля.

DeepSeek V4-Flash: когда нужно ещё дешевле

Если даже промо-тариф V4 Pro кажется избыточным для задачи, есть младшая модель — DeepSeek V4-Flash по цене $0.14 / $0.28 за 1M токенов (≈ 10 / 20 ₽). Это примерно втрое дешевле промо-V4 Pro и более чем в сто раз дешевле GPT-5.5 на output.

Flash имеет смысл там, где не нужен максимум reasoning:

классификация и маршрутизация запросов (определить тему, язык, тональность);
извлечение структурированных данных из текста (парсинг, тегирование);
короткие ответы в чате с простыми вопросами;
предварительная фильтрация перед отправкой сложных запросов в старшую модель.

Типовая архитектура «два уровня»: дешёвый Flash сортирует входящие и обрабатывает 80% простых запросов, а оставшиеся 20% сложных уходят на V4 Pro или флагман. Такой роутинг по моделям часто срезает счёт ещё в несколько раз поверх и без того низкой цены DeepSeek. Подробнее про то, как разные модели закрывают разные ниши, мы разбирали в обзоре топ-5 LLM 2026 года.

Как подключить DeepSeek API из России за 5 минут

DeepSeek API — OpenAI-совместимый. Это значит, что подключение в существующий код сводится к замене двух вещей: base_url на endpoint provod.ai и model на идентификатор DeepSeek. Остальной код, написанный под официальный OpenAI SDK, работает без изменений — те же chat.completions.create, те же роли сообщений, тот же streaming.

Python (официальный openai SDK):

from openai import OpenAI

client = OpenAI(
 api_key="prm-xxxxxxxxxxxx", # ключ provod.ai
 base_url="https://api.provod.ai/v1",
)

response = client.chat.completions.create(
 model="deepseek/deepseek-v4-pro", # для дешёвой версии: deepseek/deepseek-v4-flash
 messages=[
 {"role": "user", "content": "Напиши функцию бинарного поиска на Python с тестами"},
 ],
)
print(response.choices[0].message.content)

Node.js (openai npm-пакет):

import OpenAI from "openai";

const client = new OpenAI({
 apiKey: "prm-xxxxxxxxxxxx",
 baseURL: "https://api.provod.ai/v1",
});

const response = await client.chat.completions.create({
 model: "deepseek/deepseek-v4-pro",
 messages: [
 { role: "user", content: "Напиши функцию бинарного поиска на Python с тестами" },
 ],
});
console.log(response.choices[0].message.content);

Хорошая практика — держать base_url и model в переменных окружения, чтобы переключаться между моделями и провайдерами без правки кода:

import os
from openai import OpenAI

#.env:
# OPENAI_BASE_URL=https://api.provod.ai/v1
# OPENAI_API_KEY=prm-xxxxxxxxxxxx
# MODEL=deepseek/deepseek-v4-pro

client = OpenAI(
 api_key=os.environ["OPENAI_API_KEY"],
 base_url=os.environ["OPENAI_BASE_URL"],
)

response = client.chat.completions.create(
 model=os.environ["MODEL"],
 messages=[{"role": "user", "content": "Привет"}],
)

Если у вас уже есть код под OpenAI и вы хотите попробовать DeepSeek на A/B — достаточно поменять одну переменную MODEL и сравнить качество ответов на своей реальной нагрузке. Никакого нового SDK, никакой переписи интеграции.

Когда выбирать DeepSeek, а когда флагман

DeepSeek — не «замена всему». Честная картина выглядит так.

Берите DeepSeek V4 Pro, когда:

основная нагрузка — генерация и рефакторинг кода, разбор ошибок, алгоритмические задачи;
нужно решать математику и формальную логику с пошаговым выводом;
объёмы большие, и цена за токен напрямую влияет на юнит-экономику;
нужен длинный контекст (репозиторий, документация) при низкой цене за 1M;
задача текстовая — мультимодальность (изображения, аудио) не требуется.

Берите премиум-флагман (GPT-5.5 / Claude Opus 4.8), когда:

нужна максимальная надёжность ответа с первой попытки в сложном agentic-сценарии, где цена ошибки выше цены токенов;
требуется мультимодальность: анализ изображений, аудио, видео в одном запросе;
задача — тонкий копирайтинг, нюансированный диалог, работа с подтекстом, где премиум-модели заметно лучше;
регуляторные или контрактные требования диктуют конкретного вендора.

Берите V4-Flash, когда: задача простая и массовая — классификация, извлечение данных, короткие ответы, фильтрация перед старшей моделью.

Самый прагматичный подход — не выбирать одну модель навсегда, а маршрутизировать запросы: простое → Flash, основной объём кода и логики → V4 Pro, редкие критичные сложные кейсы → флагман. Поскольку все они доступны через один OpenAI-совместимый endpoint и один ключ, такой роутинг — это вопрос параметра model в запросе, а не отдельных интеграций.

Оплата DeepSeek на юр.лицо: документы и легальность

Техническая сторона — половина дела. Для команды в компании вторая половина — как это оплатить и провести в бухгалтерии так, чтобы расходы корректно встали в учёт.

Прямая оплата DeepSeek с российской карты или через VPN упирается в те же проблемы, что и любой зарубежный AI-сервис: валютный платёж юрлица в адрес иностранной компании требует основания (договор, счёт, акт), которого при оплате личной картой сотрудника нет. Расходы без правильно оформленных закрывающих документов не принимаются к учёту как затраты бизнеса.

Через provod.ai схема прозрачна:

Российская компания заключает договор-оферту с резидентом РФ — российское юр.лицо.
Оплачивает счёт в рублях на расчётный счёт юр.лица.
Получает доступ к DeepSeek (и остальным моделям) через единый API-endpoint.
В конце периода получает полный пакет закрывающих документов — счёт, акт, счёт-фактуру, УПД — через ЭДО (Диадок / СБИС).
Бухгалтерия проводит расходы корректно, документы приходят в учётную систему автоматически через электронный документооборот.

Оплата идёт на юр.лицо с полным пакетом первички, работаем через ЭДО — это снимает вопрос «как объяснить ФНС платёж в адрес китайского AI-провайдера». Подробный разбор юридической стороны работы с зарубежными LLM на компанию — в отдельном материале: легально ли использовать AI API на юрлицо.

Отдельно про цену: наценки на токены нет — DeepSeek стоит ровно столько, сколько в официальном прайсе провайдера, пересчитанном по курсу ЦБ. Сервисная комиссия 5% берётся только при пополнении баланса, а не с каждого токена. То есть промо-тариф $0.435 / $0.87 вы получаете один-в-один, без скрытой маржи сверху.

provod.ai — Russian LLM API aggregator. One OpenAI-compatible endpoint to all flagship models: OpenAI (GPT-5.5, GPT-5.4), Anthropic (Claude Opus 4.8, Sonnet 4.6), Google (Gemini 3.1 Pro, 3.5 Flash), DeepSeek V4 Pro, Qwen 3.6 Plus.

Provider prices 1-to-1 at CBR rate — no markup on tokens. Ruble billing per contract, full closing documents through EDI. No VPN — legal B2B service in Russia.

Try: provod.ai · model catalog · docs