DEV Community

Promptra Team for Promptra

Posted on

Qwen 3.6 Plus (Alibaba) API за рубли: многоязычная open-weight модель

Столбчатая диаграмма стоимости 1М входных токенов в рублях по моделям: Qwen 3.6 Plus самый дешёвый вход, столбец выделен терракотовым цветом

Qwen 3.6 Plus — многоязычная open-weight модель от Alibaba (линейка Qwen, она же Tongyi Qianwen). Через Promptra она стоит 20 ₽ за 1M входных токенов и 130 ₽ за 1M выходных — это цена 1-в-1 с прайсом DashScope ($0.325 и $1.95 за 1M) по курсу ЦБ РФ на 27.05.2026 (71.668 ₽/$), без наценки на токены. Контекстное окно — 1 000 000 токенов, максимум на выход — 65 536 токенов. Модель сильна в многоязычных задачах (особенно азиатские языки) и в коде, а на входе — одна из самых дешёвых в каталоге. Подключение занимает пять минут: API совместим с OpenAI, в коде меняется один параметр base_url на https://api.promptra.ru/v1. Оплата идёт на российское юр.лицо с полным пакетом закрывающих документов через ЭДО.

Главное, что выделяет Qwen 3.6 Plus среди дешёвых моделей, — это асимметрия цены: вход стоит копейки (20 ₽/1M), а выход дороже входа в 6.5 раза (130 ₽/1M). Для нагрузок, где много контекста на входе и короткий ответ на выходе — классификация, извлечение полей, RAG-ответы по большой базе — это почти идеальный профиль: вы платите символически за то, что модель «прочитала» гигантский контекст, и совсем немного за короткий вывод. Ниже разберём, где Qwen выигрывает по деньгам у DeepSeek, GLM и флагманов, для каких задач его берут, и как подключить из России без VPN. Все цены — на 29.05.2026.

Что такое Qwen 3.6 Plus и для каких задач

Qwen — это семейство языковых моделей, которое разрабатывает Alibaba Cloud. Линейка существует с 2023 года и за это время выросла в одну из самых заметных open-weight экосистем мира: десятки моделей разного размера, от компактных до флагманских, плюс специализированные версии под код, математику и зрение. Qwen 3.6 Plus — старшая «плюс»-модель текущего поколения, рассчитанная на широкий спектр задач при низкой цене.

Две вещи определяют её характер. Первая — многоязычность. Qwen традиционно силён за пределами английского: китайский, японский, корейский и другие азиатские языки модель обрабатывает заметно лучше, чем большинство западных моделей сопоставимой цены. Русский Qwen тоже поддерживает — для многих повседневных задач (резюмирование, классификация, извлечение данных, генерация описаний) этого достаточно. Если ваш продукт работает с мультиязычным контентом или с азиатскими рынками, Qwen — естественный кандидат.

Вторая — open-weight. Веса Qwen опубликованы под открытой лицензией: модель можно скачать и запускать на своём железе. Для большинства команд это не означает «будем хоститься сами» — это операционно дорого и сложно, — но означает важную вещь: модель не привязана к единственному вендору. Её отдаёт сама Alibaba через DashScope и десятки независимых инференс-провайдеров, и конкуренция держит цену низкой. Именно поэтому Qwen, как и DeepSeek, стоит в разы дешевле проприетарных флагманов.

Ключевые технические характеристики из нашего каталога:

Параметр Значение
Идентификатор модели qwen3.6-plus
Провайдер Alibaba Qwen
Тип весов open-weight (открытая лицензия)
Контекстное окно 1 000 000 токенов
Максимум на выход 65 536 токенов
Модальности входа текст
Модальности выхода текст
Endpoints chat

Миллион токенов контекста — это ориентировочно 700–750 тысяч слов или порядка 50 000 строк кода. В одно окно влезает кодовая база среднего сервиса, объёмный архив документов или длинная история диалога целиком. На фоне таких возможностей цена входа в 20 ₽ за 1M делает Qwen 3.6 Plus инструментом, которым можно «скармливать» большие объёмы контекста, почти не глядя на счёт за вход.

Карточка модели Qwen 3.6 Plus с подписями на русском: контекст 1 000 000 токенов, выход 65 536, вход 20 рублей за 1М, выход 130 рублей за 1М, тип open-weight, провайдер Alibaba, тёплая бежевая палитра с терракотовым акцентом

Цена Qwen 3.6 Plus в рублях: полная таблица

Promptra не накручивает наценку на токены. Стоимость модели равна официальному прайсу Alibaba DashScope, пересчитанному в рубли по курсу ЦБ РФ. Сервисная комиссия 5% берётся только при пополнении баланса, а не с каждого запроса, поэтому в расчётах за токены её нет. Базовый прайс публикуется на странице цен Alibaba Cloud Model Studio; рейт по конкретной версии 3.6 Plus также сверяется по листингу openrouter.ai/qwen/qwen3.6-plus.

Тип токенов Цена DashScope (USD за 1M) Цена Promptra (₽ за 1M)
Вход (input) $0.325 20 ₽
Выход (output) $1.95 130 ₽

Курс пересчёта: 1 USD = 71.668 ₽ (ЦБ РФ на 27.05.2026). Точная арифметика: $0.325 × 71.668 ≈ 23.3 ₽, $1.95 × 71.668 ≈ 139.8 ₽. В каталоге значения округлены вниз до 20 и 130 ₽ — фактический счёт считается по курсу ЦБ на день пополнения, поэтому в разные дни рублёвая цифра слегка плавает вслед за курсом, а долларовая ставка остаётся фиксированной.

Отдельно отметим важный нюанс линейки Qwen: у моделей Alibaba исторически тарификация зависит от длины контекста и режима. На официальной странице цен старшие Qwen-модели разбиты на тарифные диапазоны (например, до 256K входных токенов — одна ставка, выше — другая), а «думающий» режим (reasoning) тарифицируется по более высокой выходной ставке, чем обычная генерация. В нашем каталоге для qwen3.6-plus зафиксирована единая ставка 20/130 ₽, которая и применяется к запросам через Promptra; если вы строите пайплайн с очень длинным контекстом или с reasoning-режимом, имеет смысл свериться с официальным прайсом Alibaba по конкретному сценарию.

Чтобы понимать порядок расходов, прикинем стоимость типовых сценариев. Соотношение вход/выход в реальной нагрузке обычно смещено в сторону входа (длинный промпт + контекст, короткий ответ) — а это ровно тот профиль, на котором дешёвый вход Qwen раскрывается максимально.

Сценарий Вход Выход Стоимость
Короткий чат-запрос 1K 0.5K ≈ 0.085 ₽
Классификация документа 20K 0.3K ≈ 0.44 ₽
RAG-ответ по базе знаний 80K 2K ≈ 1.86 ₽
Анализ кода на 50K токенов 50K 4K ≈ 1.52 ₽

Цифры приблизительные и зависят от точного количества токенов в ваших данных. Считаются они просто: (входные_токены / 1 000 000 × 20) + (выходные_токены / 1 000 000 × 130). Реальный расход всегда видно в дашборде по факту запроса. Обратите внимание на масштаб: RAG-ответ с контекстом на 80 тысяч токенов обходится менее чем в 2 ₽ — на флагманах такой же запрос стоил бы десятки рублей.

Где Qwen дешевле всех: разбор асимметрии вход/выход

Главный экономический сюжет Qwen 3.6 Plus — это разрыв между ценой входа и выхода. Вход стоит 20 ₽/1M, выход — 130 ₽/1M, то есть выход дороже входа в 6.5 раза. Это не дефект, а характеристика, которую можно использовать в свою пользу. Сравним соотношения у нескольких дешёвых и средних моделей каталога:

Модель Вход (₽/1M) Выход (₽/1M) Выход / вход
Qwen 3.6 Plus 20 ₽ 130 ₽ ×6.5
MiniMax M2.7 20 ₽ 80 ₽ ×4.0
DeepSeek V4 Pro (промо) 30 ₽ 60 ₽ ×2.0
Kimi K2.5 40 ₽ 170 ₽ ×4.25
GLM 5.1 100 ₽ 310 ₽ ×3.1

Вывод читается прямо из таблицы. Qwen 3.6 Plus и MiniMax M2.7 делят первое место по дешевизне входа (20 ₽/1M), но у Qwen выход дороже. Значит, Qwen оптимален там, где входной контекст большой, а выход короткий: вы платите символическую цену за то, что модель «прочитала» много контекста, и немного — за короткий ответ. И наоборот: если задача генеративная (длинные тексты, развёрнутые ответы, большой output), асимметрия работает против вас, и стоит присмотреться к DeepSeek с его ровным соотношением ×2.

Разложим это на конкретные классы задач:

Идеальный профиль для Qwen (много входа, мало выхода):

  • Классификация и маршрутизация. На вход — текст обращения, документа, тикета; на выход — короткая метка категории. Вход может быть длинным, выход — несколько токенов.
  • Извлечение полей (extraction). На вход — договор, инвойс, резюме; на выход — структурированный JSON с полями. Выход обычно в разы короче входа.
  • RAG-ответы. На вход — вопрос плюс извлечённые фрагменты базы знаний (часто десятки тысяч токенов); на выход — короткий ответ по существу.
  • Модерация и скоринг. На вход — контент; на выход — оценка или флаг.

Менее выгодный профиль (много выхода):

  • Генерация длинных статей, описаний товаров пачками, развёрнутых отчётов — здесь основной счёт формирует выход, и Qwen теряет часть ценового преимущества. Для таких задач сравните его с DeepSeek (выход 60 ₽/1M в промо-период).

Схема с двумя профилями нагрузки и подписями на русском: слева блок «много входа, короткий выход» со стрелкой к Qwen 3.6 Plus как оптимальному выбору, справа блок «длинный выход» со стрелкой к DeepSeek, стрелки и рамки терракотовые на бежевом фоне

Как подключить Qwen 3.6 Plus из России: drop-in через OpenAI SDK

Технически Qwen 3.6 Plus подключается так же, как любая модель в каталоге, — потому что API Promptra совместим с OpenAI на уровне протокола. Это не случайность: сама Alibaba отдаёт Qwen через OpenAI-совместимый endpoint DashScope (https://dashscope-intl.aliyuncs.com/compatible-mode/v1) и в своей документации прямо рекомендует мигрировать с OpenAI-кода, поменяв ключ, base_url и имя модели. Через Promptra логика та же, но base_url один на все модели каталога, а оплата — в рублях на юр.лицо.

Меняется ровно один параметр — base_url. Ключ заменяется на ключ Promptra, имя модели указывается как qwen3.6-plus, остальной код остаётся прежним.

Python

from openai import OpenAI

client = OpenAI(
 api_key="prm-xxxxxxxxxxxx", # ключ Promptra
 base_url="https://api.promptra.ru/v1", # единственное изменение
)

response = client.chat.completions.create(
 model="qwen3.6-plus",
 messages=[
 {"role": "system", "content": "Ты — ассистент по извлечению данных. Отвечай строго JSON."},
 {"role": "user", "content": "Извлеки ИНН и сумму из текста:..."},
 ],
)

print(response.choices[0].message.content)
Enter fullscreen mode Exit fullscreen mode

Node.js

import OpenAI from "openai";

const client = new OpenAI({
 apiKey: "prm-xxxxxxxxxxxx",
 baseURL: "https://api.promptra.ru/v1", // единственное изменение
});

const response = await client.chat.completions.create({
 model: "qwen3.6-plus",
 messages: [
 { role: "system", content: "Ты — ассистент по извлечению данных. Отвечай строго JSON." },
 { role: "user", content: "Извлеки ИНН и сумму из текста:..." },
 ],
});

console.log(response.choices[0].message.content);
Enter fullscreen mode Exit fullscreen mode

Хорошая практика: base_url в переменной окружения

Чтобы не зашивать endpoint в код и иметь возможность переключаться между моделями за секунды, держите base_url и ключ в .env:

import os
from openai import OpenAI

# В.env:
# OPENAI_API_KEY=prm-xxxxxxxxxxxx
# OPENAI_BASE_URL=https://api.promptra.ru/v1

client = OpenAI(
 api_key=os.environ["OPENAI_API_KEY"],
 base_url=os.environ["OPENAI_BASE_URL"],
)

response = client.chat.completions.create(
 model="qwen3.6-plus",
 messages=[{"role": "user", "content": "Привет"}],
)
Enter fullscreen mode Exit fullscreen mode

Проверить, что подключение работает, можно одним curl-запросом без всякого SDK:

curl https://api.promptra.ru/v1/chat/completions \
 -H "Authorization: Bearer prm-xxxxxxxxxxxx" \
 -H "Content-Type: application/json" \
 -d '{
 "model": "qwen3.6-plus",
 "messages": [{"role": "user", "content": "ping"}]
 }'
Enter fullscreen mode Exit fullscreen mode

Если в ответ пришёл JSON с полем choices — модель отвечает, можно подключать в продакшен. Удобство OpenAI-совместимого протокола в том, что одну и ту же кодовую базу можно перенаправить с Qwen на DeepSeek или флагман сменой одной строки model — без переписывания интеграции.

Схема drop-in замены base_url с подписями на русском: блок кода OpenAI SDK, стрелка к параметру base_url со значением api.promptra.ru слэш v1, ниже три модели qwen3.6-plus, deepseek-v4-pro, gpt-5.5 как взаимозаменяемые значения поля model, акцентная терракотовая стрелка на бежевом фоне

Qwen vs DeepSeek vs GLM: какую дешёвую модель выбрать

В каталоге несколько недорогих open-weight и азиатских моделей, и вопрос «какую взять» сводится не к «какая лучшая», а к «какая дешевле для моего профиля и сильна в нужной мне области». Сведём основных кандидатов в таблицу (цены — из каталога, 1-в-1 с прайсом провайдера по курсу ЦБ).

Модель Вход (₽/1M) Выход (₽/1M) Контекст Сильные стороны
Qwen 3.6 Plus 20 ₽ 130 ₽ 1M Многоязычность (азиатские языки), код, дешёвый вход
DeepSeek V4 Pro (промо) 30 ₽ 60 ₽ 1M Код и матлогика, дешёвый и ровный выход
GLM 5.1 100 ₽ 310 ₽ ~203K Reasoning, сбалансированная универсальная модель
MiniMax M2.7 20 ₽ 80 ₽ ~205K Дешёвый вход, универсал, азиатская модель
Kimi K2.5 40 ₽ 170 ₽ ~262K Длинные документы, vision на входе

USD-прайс для справки: Qwen 3.6 Plus — $0.325/$1.95, DeepSeek V4 Pro — $0.435/$0.87 (промо до 31.05.2026, базовая ставка после ≈ $1.74/$3.48), GLM 5.1 — $1.4/$4.4, MiniMax M2.7 — $0.3/$1.2, Kimi K2.5 — $0.6/$2.5.

Берите Qwen 3.6 Plus, когда: в задаче много входного контекста и короткий выход (классификация, извлечение, RAG, модерация), либо когда важна работа с азиатскими языками. Контекст 1M позволяет загружать огромные объёмы, а вход в 20 ₽/1M делает это почти бесплатным. Это лучший выбор для «прочитать много — ответить коротко».

Берите DeepSeek V4 Pro, когда: задача генеративная (длинный выход) или это код и математика. У DeepSeek ровное соотношение вход/выход (×2) и самый дешёвый выход в этой группе (60 ₽/1M в промо). Важная оговорка: промо-скидка −75% действует до 31 мая 2026, после чего базовая ставка вырастет примерно вчетверо. Подробный разбор — в статье про DeepSeek V4 Pro API за рубли.

Берите GLM 5.1, когда: нужен крепкий универсал с акцентом на reasoning и вы готовы платить за качество ответа больше, чем за Qwen или DeepSeek. GLM дороже (100/310 ₽), но это сбалансированная модель под широкий класс задач. Разбор — в статье про GLM 5.1 (Z.ai) API за рубли.

Берите MiniMax M2.7 или Kimi K2.5, когда: MiniMax — как дешёвая универсальная альтернатива Qwen с более выгодным выходом, но меньшим контекстом (около 205K против 1M). Kimi — когда нужны очень длинные документы (262K контекст) и приём изображений на входе.

Практический совет тот же, что и для флагманов: возьмите репрезентативную выборку ваших реальных запросов, прогоните на двух-трёх кандидатах и сравните не только цену, но и качество ответа на вашем классе задач и языке. OpenAI-совместимый протокол делает такой A/B-тест вопросом смены одной строки model.

Дерево решения выбора дешёвой модели с подписями на русском: корневой вопрос о профиле задачи ветвится на «много входа, короткий выход» к Qwen, «длинный выход, код» к DeepSeek, «нужен reasoning» к GLM, «очень длинные документы» к Kimi, прямоугольники и стрелки в тёплой палитре с терракотовыми акцентами

Qwen 3.6 Plus против флагманов: когда экономия оправдана

Полезно понять, насколько именно Qwen дешевле топовых моделей — и где эта экономия имеет смысл, а где нет. Сравним вход и выход с флагманами каталога.

Модель Вход (₽/1M) Выход (₽/1M) Контекст
Qwen 3.6 Plus 20 ₽ 130 ₽ 1M
Gemini 3.1 Pro 140 ₽ 860 ₽ 1M
Claude Opus 4.7 350 ₽ 1790 ₽ 1M
GPT-5.5 350 ₽ 2150 ₽ 1.05M

Цифры показывают разрыв наглядно. Вход Qwen дешевле GPT-5.5 в 17.5 раза (20 ₽ против 350 ₽), выход — в 16.5 раза (130 ₽ против 2150 ₽). Даже против самого дешёвого из флагманов, Gemini 3.1 Pro, Qwen дешевле в 7 раз по входу и в 6.6 раза по выходу. При этом контекст у Qwen такой же — 1M токенов.

Значит ли это, что Qwen всегда выгоднее? Нет. Разница в цене отражает разницу в назначении. Флагманы (GPT-5.5, Claude Opus 4.7) берут там, где цена ошибки выше цены токенов: сложный многошаговый reasoning, агентные пайплайны с планированием, код с длинными цепочками зависимостей. На таких задачах дешёвая модель может «срываться» — путать требования, терять нить, выдавать правдоподобный, но неверный ответ, — и тогда экономия на токенах оборачивается потерями на исправлении ошибок.

Qwen 3.6 Plus раскрывается на массовых задачах средней сложности, где важен объём и цена за единицу, а не предельное качество рассуждения: обработка очередей, классификация потока обращений, извлечение данных из тысяч документов, RAG-ответы. На потоке в миллионы запросов 17-кратная разница в цене входа превращается в принципиально иной порядок расходов. Многие команды строят гибридную схему: Qwen или DeepSeek на потоке простых и средних задач, флагман — точечно, только на запросах, где он реально нужен. Развёрнутое сравнение всех моделей мы собрали в обзоре топ-5 LLM 2026.

Лимиты, контекст и максимальный выход

Помимо цены, у Qwen 3.6 Plus есть архитектурные лимиты, которые важно учитывать при проектировании:

  • Контекстное окно — 1 000 000 токенов. Это суммарный объём «вход + всё, что модель удерживает в рамках запроса». Один из крупнейших контекстов в каталоге наравне с флагманами — позволяет загрузить очень большой объём данных за один вызов.
  • Максимум на выход — 65 536 токенов. Сколько модель может сгенерировать в одном ответе. Это вдвое меньше, чем у флагманов (у GPT-5.5 и Claude — 128K), но 65K токенов — это порядка 45–50 тысяч слов, объём большой статьи или главы. Для подавляющего большинства задач этого достаточно с запасом; для генерации очень длинных документов лимит держите в голове.
  • Модальности — только текст. Qwen 3.6 Plus в нашем каталоге работает с текстом на входе и выходе. Если нужна обработка изображений на входе, смотрите в сторону моделей с vision (например, Kimi K2.5 или флагманы Claude/GPT/Gemini).
  • Endpoint — chat. Модель доступна через стандартный chat-completions API, совместимый с OpenAI SDK, как в примерах выше.

Если задача упирается в лимит выхода (нужно сгенерировать документ длиннее 65K токенов), стандартное решение — разбивать генерацию на части с продолжением контекста, а не пытаться выжать всё в один вызов.

Сколько стоит Qwen 3.6 Plus в месяц: прикидка для команды

Чтобы цена в ₽ за миллион токенов превратилась в понятную цифру месячного бюджета, прикинем три профиля нагрузки — все смещены в сторону «много входа, короткий выход», где Qwen наиболее выгоден. Допущения указаны рядом — подставьте свои.

Профиль Запросов/мес Средний вход Средний выход Токенов вход/мес Токенов выход/мес Стоимость/мес
Классификация потока 1 000 000 2K 0.1K 2B 100M ≈ 53 000 ₽
RAG-ассистент 200 000 30K 1K 6B 200M ≈ 146 000 ₽
Извлечение из документов 100 000 15K 0.5K 1.5B 50M ≈ 36 500 ₽

Расчёт прямой: входные токены за месяц делим на миллион и умножаем на 20 ₽, выходные — на 130 ₽, складываем. Например, для «классификации потока»: 2000 × 20 + 100 × 130 = 40 000 + 13 000 = 53 000 ₽ за миллион запросов в месяц.

Видно, что даже на миллионе запросов с контекстом по 2 тысячи токенов счёт держится в районе 53 тысяч рублей — за тот же объём на GPT-5.5 он измерялся бы сотнями тысяч. Это и есть основной аргумент в пользу Qwen на массовых задачах:

Тот же миллион запросов на разных моделях (2K вход + 0.1K выход)

Модель Стоимость 1М запросов в месяц Кратность к Qwen 3.6 Plus
Qwen 3.6 Plus 53 000 ₽ ×1
MiniMax M2.7 48 000 ₽ ×0.9 (ещё дешевле)
DeepSeek V4 Pro (промо) 66 000 ₽ ×1.25
GLM 5.1 231 000 ₽ ×4.4
GPT-5.4 mini 132 000 ₽ ×2.5
GPT-5.4 447 000 ₽ ×8.4
Claude Sonnet 4.6 527 000 ₽ ×9.9
GPT-5.5 915 000 ₽ ×17.3

На профиле «много входа — короткий выход» (классификация, извлечение, RAG-ответы) Qwen 3.6 Plus и MiniMax M2.7 — самые выгодные модели каталога. Разница против GPT-5.5 — почти в 18 раз.

при сопоставимом качестве для классификации и извлечения порядок расходов принципиально другой. Сервисная комиссия Promptra (5%) при этом берётся один раз при пополнении баланса, а не с каждого из этих запросов.

Оплата и документы для юр.лица

Для команд в компаниях важна не только цена токена, но и то, как эти расходы проходят по бухгалтерии. Promptra принимает оплату на российское юр.лицо — российское юр.лицо — с полным пакетом закрывающих документов: договор-оферта, счёт, акт, счёт-фактура, УПД. Документооборот идёт через ЭДО (Диадок, СБИС), что удобно для корпоративной бухгалтерии — документы автоматически проводятся в учётной системе.

С Qwen этот аргумент особенно практичен. Прямой доступ к DashScope из России — это зарубежная карта, валютный платёж и отсутствие закрывающих документов российского формата: расход сложно корректно учесть. Через Promptra вы получаете ту же модель по той же цене (1-в-1 с прайсом Alibaba по курсу ЦБ), но платите в рублях и с первичкой, которую без вопросов примет ваша бухгалтерия. Любой бухгалтер и налоговый инспектор смотрят в первую очередь на документы — и здесь у вас полный комплект. Подробно тему закрывающих документов и того, легально ли использовать зарубежные LLM на юрлицо в РФ, мы разобрали в гайде легально ли использовать AI API на юрлицо.


Promptra — Russian LLM API aggregator. One OpenAI-compatible endpoint to all flagship models: OpenAI (GPT-5.5, GPT-5.4), Anthropic (Claude Opus 4.7, Sonnet 4.6), Google (Gemini 3.1 Pro, 3.5 Flash), DeepSeek V4 Pro, Qwen 3.6 Plus.

Provider prices 1-to-1 at CBR rate — no markup on tokens. Ruble billing per contract, full closing documents through EDI. No VPN — legal B2B service in Russia.

Try: promptra.ru · model catalog · docs

Top comments (0)