Коротко: пользоваться Qwen из России в 2026 году можно, и платить за это можно в рублях на юридическое лицо. Qwen — это семейство языковых моделей Alibaba (китайское имя — Tongyi Qianwen), и его старшая модель текущего поколения, Qwen 3.6 Plus, доступна из РФ через API-агрегатор с OpenAI-совместимым endpoint. В коде меняется один параметр — base_url на https://api.promptra.ru/v1 — а оплата идёт рублёвой платёжкой, а не зарубежной картой. Это не обход блокировок и не VPN: запрос уходит на российский endpoint, агрегатор проксирует его в Qwen от своего имени, а вы получаете результат, рублёвый счёт и закрывающие документы. Цена — 1-в-1 с прайсом Alibaba DashScope по курсу ЦБ: 20 ₽ за 1M входных токенов и 130 ₽ за 1M выходных.
Чем Qwen интересен российскому разработчику в двух словах: это многоязычная open-weight модель (сильная в азиатских языках и коде), с окном контекста на 1 миллион токенов, и при этом одна из самых дешёвых на рынке по входным токенам. Этот материал разбирает обе стороны вопроса: что такое Qwen и какие модели в линейке, в чём его сильные стороны, почему прямой доступ из РФ затруднён, и как именно подключить Qwen по API за пять минут — с рабочим кодом, ценой в рублях из каталога и FAQ. Все цены — на 2026-05-29.
Что такое Qwen и какие модели в линейке
Qwen — это семейство больших языковых моделей, которое разрабатывает Alibaba Cloud. В китайском оригинале линейка называется Tongyi Qianwen, в международной версии — просто Qwen. Существует она с 2023 года и за это время выросла в одну из самых заметных open-weight экосистем мира: десятки моделей разного размера — от компактных, помещающихся на ноутбук, до флагманских, — плюс специализированные версии под код, математику и работу с изображениями.
Для пользователя из России важно различать две вещи под одним именем Qwen, ровно как и у других провайдеров. Есть потребительский чат (веб-приложение и мобильное приложение Qwen, бывший чат Tongyi) — это продукт для конечного пользователя. И есть API-модели, которые разработчик встраивает в свой код или сервис. Доступность у них разная, и в этом материале нас интересует именно API — то, на что можно опереться в работе.
Старшая модель текущего поколения в нашем каталоге — Qwen 3.6 Plus. Это «плюс»-модель, рассчитанная на широкий спектр задач при низкой цене. Помимо неё, линейка Qwen включает целый спектр вариантов: компактные модели для локального запуска, отдельные ветки под код (Qwen Coder), под рассуждения и под мультимодальность (Qwen-VL для изображений). На рынке Qwen известен прежде всего двумя вещами — открытыми весами и сильной многоязычностью, особенно за пределами английского.
Ключевые характеристики Qwen 3.6 Plus из нашего каталога:
| Параметр | Значение |
|---|---|
| Идентификатор модели | qwen/qwen3.6-plus |
| Провайдер | Alibaba Qwen (Tongyi Qianwen) |
| Тип весов | open-weight (открытая лицензия) |
| Контекстное окно | 1 000 000 токенов |
| Максимум на выход | 65 536 токенов |
| Модальности входа | текст |
| Модальности выхода | текст |
| Endpoint |
chat (OpenAI-совместимый) |
Миллион токенов контекста — это ориентировочно 700–750 тысяч слов или порядка 50 000 строк кода. В одно окно влезает кодовая база среднего сервиса, объёмный архив документов или длинная история диалога целиком. Если вам нужен глубокий разбор именно Qwen 3.6 Plus — бенчмарки цены, тарификация по длине контекста, детальное сравнение с DeepSeek и GLM — он в отдельном материале про Qwen 3.6 Plus API за рубли. Здесь же фокус на главном вопросе: как получить доступ к Qwen из России.
Сильные стороны Qwen: многоязычность, цена и код
Почему вообще стоит присматриваться к Qwen среди десятков моделей? У линейки есть три черты, которые делают её отдельным инструментом, а не «ещё одной большой LLM».
Многоязычность — главная сила. Qwen традиционно силён за пределами английского. Китайский, японский, корейский и другие азиатские языки модель обрабатывает заметно лучше, чем большинство западных моделей сопоставимой цены — это прямое следствие того, что её обучала китайская компания на корпусе с большой долей азиатских языков. Русский Qwen тоже поддерживает: для повседневных задач (резюмирование, классификация, извлечение данных, генерация описаний) качества достаточно. Если ваш продукт работает с мультиязычным контентом или ориентирован на азиатские рынки, Qwen — естественный кандидат.
Низкая цена, особенно на входе. Qwen 3.6 Plus стоит 20 ₽ за 1M входных токенов — это одна из самых низких ставок входа во всём каталоге, в 17 с лишним раз дешевле флагманов вроде GPT-5.5. Причина в открытых весах: модель отдаёт не только сама Alibaba через DashScope, но и десятки независимых инференс-провайдеров, и конкуренция между ними держит цену низкой. По той же причине дёшев и DeepSeek. Для нагрузок, где много входного контекста и короткий ответ — классификация, извлечение полей, RAG-ответы по большой базе — это почти идеальный профиль: вы платите символически за то, что модель «прочитала» большой контекст.
Код и инструментальные задачи. Внутри семейства есть отдельная сильная ветка под программирование (Qwen Coder), и сам Qwen 3.6 Plus неплохо справляется с генерацией и разбором кода. Alibaba позиционирует поколение 3.6 как шаг в сторону «агентных» сценариев — работы с инструментами и многошаговых задач; подробности компания описывает в блоге Alibaba Cloud о Qwen3.6-Plus.
Где Qwen не первый выбор — это задачи на предельно сложный reasoning и длинные агентные циклы, где цена ошибки выше цены токенов: в эту нишу чаще берут западные флагманы (Claude, GPT-5.5). Но для массовых задач средней сложности, многоязычной обработки и всего, где важен объём при разумной цене, Qwen — рациональный выбор.
Почему прямой доступ к Qwen из России затруднён
«Qwen в России» — это, как и у других зарубежных провайдеров, два разных вопроса с разными ответами. Доступ к потребительскому приложению и доступ к API устроены по-разному и упираются в разные ограничения.
Приложение и личный кабинет DashScope
Потребительский чат Qwen и консоль Alibaba Cloud Model Studio (платформа DashScope, через которую Alibaba отдаёт модели) рассчитаны на свои регионы и платёжные системы. Из России регистрация спотыкается о привычные барьеры: верификация аккаунта Alibaba Cloud требует данных и платёжных реквизитов, которые российскому пользователю трудно предоставить, а часть функций завязана на китайскую или международную платёжную инфраструктуру. Сам сайт при этом обычно открывается — проблема не в доступности страницы, а в том, что пройти регистрацию и довести дело до оплаты не получается.
Оплата — главный барьер
Ключевая стена — деньги. У Alibaba Cloud собственная платёжная платформа, рассчитанная на международные карты и китайские платёжные системы. Когда российский пользователь доходит до пополнения баланса DashScope, он упирается в типичные барьеры:
- Карта не проходит. Карты МИР зарубежными эквайрингами не принимаются в принципе, а российские Visa/Mastercard после 2022 года не работают за пределами РФ. Пополнить долларовый или юаневый баланс DashScope такой картой не выйдет.
- Нет рублёвого счёта и документов. Даже если оплата как-то проходит через зарубежную виртуальную карту, вы получаете списание в валюте без российских закрывающих документов. Для компании это означает, что расход нельзя корректно провести в учёте.
- Валютный платёж юрлица — отдельная история. Прямой платёж российской компании иностранному поставщику требует основания (контракт, инвойс) и проходит через валютный контроль банка. Городить эту схему ради API-подписки на несколько тысяч рублей в месяц экономически бессмысленно.
Дальше обычно идут два народных пути, и у обоих есть честные минусы. Зарубежная виртуальная карта (VCC): вы пополняете её в рублях, она выпускает Visa/Mastercard в долларах, вы привязываете её к DashScope. Минусы — курс конвертации выше биржевого (типичная наценка 4–7%), комиссии за выпуск и пополнение, и главное — никаких закрывающих документов. Запуск весов у себя: Qwen open-weight, теоретически модель можно скачать и хостить локально, но для версии уровня 3.6 Plus нужен серьёзный GPU-кластер, инженер по инференсу и постоянное обслуживание — для команды, которой нужно просто «дёргать модель из кода», это несоразмерные затраты.
Важно про формулировки
Речь не про «обход блокировок» и не про серые схемы. API можно легально проксировать через посредника: агрегатор с юр.лицом в поддерживаемом регионе делает запрос к Qwen от своего имени и отдаёт вам результат через российский endpoint с рублёвой оплатой. С точки зрения Alibaba — это его легальный клиент, соблюдающий условия. С точки зрения российского пользователя — это сервис с договором, документами и поддержкой на русском. Никакого VPN, никакой зарубежной карты, никакого аккаунта в DashScope на вашей стороне. Именно поэтому предсказуемый способ работать с Qwen из России — это API через агрегатор.
Как пользоваться Qwen в России через API: пошагово
Самый практичный способ работать с Qwen из России — не нативный SDK Alibaba, а OpenAI-совместимый endpoint. Это не случайность и не костыль агрегатора: сама Alibaba отдаёт Qwen через OpenAI-совместимый режим DashScope и в своей документации прямо рекомендует мигрировать с OpenAI-кода, поменяв ключ, base_url и имя модели. Promptra принимает запросы в формате OpenAI Chat Completions и сам транслирует их в Qwen — значит, весь существующий код на openai SDK работает без переписывания. Разберём по шагам.
Шаг 1. Получить ключ. Регистрируетесь на стороне агрегатора (на Promptra достаточно телефона — без email и зарубежной верификации) и получаете API-ключ вида prm-....
Шаг 2. Пополнить баланс в рублях. Оплата идёт рублёвой платёжкой. Цена за токены — один-в-один с прайсом Alibaba по курсу ЦБ, без наценки на токены. Сервисная комиссия 5% берётся только при пополнении баланса, а не от токенов.
Шаг 3. Поменять base_url в коде. Это вся «миграция». Вместо адреса DashScope вы указываете российский endpoint и модель qwen/qwen3.6-plus.
Шаг 4. Сделать запрос. Дальше код работает как обычно — модель отвечает, вы получаете результат.
Вот рабочий пример на Python. Клиент — стандартный openai, меняется только base_url, ключ и имя модели:
from openai import OpenAI
client = OpenAI(
api_key="prm-xxxxxxxxxxxx", # ключ Promptra
base_url="https://api.promptra.ru/v1", # единственное изменение
)
response = client.chat.completions.create(
model="qwen/qwen3.6-plus",
messages=[
{"role": "system", "content": "Ты — ассистент по извлечению данных. Отвечай строго JSON."},
{"role": "user", "content": "Извлеки ИНН и сумму из текста договора:..."},
],
)
print(response.choices[0].message.content)
То же самое на Node.js:
import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.PROMPTRA_API_KEY,
baseURL: "https://api.promptra.ru/v1", // единственное изменение
});
const response = await client.chat.completions.create({
model: "qwen/qwen3.6-plus",
messages: [
{ role: "user", content: "Классифицируй обращение по категории:..." },
],
});
console.log(response.choices[0].message.content);
Хранить base_url в переменной окружения
Хорошая практика для продакшена — держать base_url и ключ в .env, а не зашивать в код. Тогда переключиться между моделями (или на fallback) можно за секунду, без передеплоя:
import os
from openai import OpenAI
# В.env:
# OPENAI_API_KEY=prm-xxxxxxxxxxxx
# OPENAI_BASE_URL=https://api.promptra.ru/v1
client = OpenAI(
api_key=os.environ["OPENAI_API_KEY"],
base_url=os.environ["OPENAI_BASE_URL"],
)
response = client.chat.completions.create(
model="qwen/qwen3.6-plus",
messages=[{"role": "user", "content": "Привет"}],
)
Проверить, что подключение работает, можно одним curl-запросом без всякого SDK:
curl https://api.promptra.ru/v1/chat/completions \
-H "Authorization: Bearer prm-xxxxxxxxxxxx" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen/qwen3.6-plus",
"messages": [{"role": "user", "content": "ping"}]
}'
Если в ответ пришёл JSON с полем choices — модель отвечает, можно подключать в продакшен. Если вы раньше ходили в DashScope напрямую, миграция сводится к замене адреса и имени модели на формат каталога — поля запроса остаются прежними. Общий разбор смены base_url на разных языках — в материале про миграцию с OpenAI SDK. Удобство OpenAI-совместимого протокола в том, что одну и ту же кодовую базу можно перенаправить с Qwen на DeepSeek или флагман сменой одной строки model — без переписывания интеграции.
Цена Qwen в рублях
Promptra не накручивает наценку на токены. Стоимость модели равна официальному прайсу Alibaba DashScope, пересчитанному в рубли по курсу ЦБ РФ на 2026-05-27: 1 USD = 71.668 ₽. Рублёвые значения округлены вниз (правило каталога). Базовый прайс публикуется на странице цен Alibaba Cloud Model Studio; ставка по конкретной версии 3.6 Plus также сверяется по листингу openrouter.ai/qwen.
| Тип токенов | Цена DashScope (USD за 1M) | Цена Promptra (₽ за 1M) |
|---|---|---|
| Вход (input) | $0.325 | 20 ₽ |
| Выход (output) | $1.95 | 130 ₽ |
Точная арифметика: $0.325 × 71.668 ≈ 23.3 ₽, $1.95 × 71.668 ≈ 139.8 ₽. В каталоге значения округлены вниз до 20 и 130 ₽; фактический счёт считается по курсу ЦБ на день пополнения, поэтому в разные дни рублёвая цифра слегка плавает вслед за курсом, а долларовая ставка остаётся фиксированной.
Чтобы понять масштаб на фоне флагманов: вход Qwen дешевле GPT-5.5 в 17.5 раза (20 ₽ против 350 ₽), а выход — в 16.5 раза (130 ₽ против 2150 ₽). При этом контекст у Qwen такой же — 1M токенов. Сравнение по входу и выходу с другими моделями каталога:
| Модель | Вход (₽/1M) | Выход (₽/1M) | Контекст |
|---|---|---|---|
| Qwen 3.6 Plus | 20 ₽ | 130 ₽ | 1M |
| DeepSeek V4 Pro (промо) | 30 ₽ | 60 ₽ | 1M |
| GLM 5.1 | 100 ₽ | 310 ₽ | около 203K |
| Gemini 3.1 Pro Preview | 140 ₽ | 860 ₽ | 1M |
| Claude Opus 4.7 | 350 ₽ | 1790 ₽ | 1M |
| GPT-5.5 | 350 ₽ | 2150 ₽ | 1.05M |
Чтобы цена за миллион токенов превратилась в понятный порядок расходов, прикинем типовые сценарии. Считается всё просто: (входные_токены / 1 000 000 × 20) + (выходные_токены / 1 000 000 × 130).
| Сценарий | Вход | Выход | Стоимость |
|---|---|---|---|
| Короткий чат-запрос | 1K | 0.5K | около 0.085 ₽ |
| Классификация документа | 20K | 0.3K | около 0.44 ₽ |
| RAG-ответ по базе знаний | 80K | 2K | около 1.86 ₽ |
| Анализ кода на 50K токенов | 50K | 4K | около 1.52 ₽ |
Обратите внимание на масштаб: RAG-ответ с контекстом на 80 тысяч токенов обходится менее чем в 2 ₽ — на флагманах такой же запрос стоил бы десятки рублей. Это и есть основной аргумент в пользу Qwen на массовых задачах.
Отдельный нюанс линейки Qwen: у моделей Alibaba исторически тарификация может зависеть от длины контекста и режима (обычная генерация против «думающего» reasoning-режима). На официальной странице цен старшие Qwen-модели разбиты на тарифные диапазоны. В нашем каталоге для qwen/qwen3.6-plus зафиксирована единая ставка 20/130 ₽, которая и применяется к запросам через Promptra; если вы строите пайплайн с очень длинным контекстом или reasoning-режимом, имеет смысл свериться с официальным прайсом Alibaba по конкретному сценарию — мы не выдумываем пороги, а отсылаем к первоисточнику.
Сценарии: где Qwen раскрывается лучше всего
Qwen — не универсальная замена всему. Он силён в конкретных сценариях и слабее в других. Коротко, чтобы не тратить бюджет зря.
Массовый объём: дешёвый вход решает
Главный экономический сюжет Qwen — очень дешёвый вход (20 ₽/1M) при умеренном выходе (130 ₽/1M). Это делает его оптимальным там, где входного контекста много, а выход короткий:
- Классификация и маршрутизация. На вход — текст обращения, документа, тикета; на выход — короткая метка категории. Вход длинный, выход — несколько токенов.
- Извлечение полей (extraction). На вход — договор, инвойс, резюме; на выход — структурированный JSON. Выход в разы короче входа.
- RAG-ответы. На вход — вопрос плюс извлечённые фрагменты базы знаний (часто десятки тысяч токенов); на выход — короткий ответ по существу.
- Модерация и скоринг. На вход — контент; на выход — оценка или флаг.
На потоке в миллионы запросов 17-кратная разница в цене входа против флагманов превращается в принципиально иной порядок расходов. Если же задача генеративная (длинные тексты, развёрнутые отчёты, большой output), асимметрия работает слабее, и стоит присмотреться к DeepSeek в России с его более дешёвым выходом — это соседняя дешёвая open-weight модель, доступная через тот же endpoint.
Многоязычные задачи
Второй естественный сценарий — всё, что связано с языками за пределами английского и русского. Поддержка клиентов на азиатских рынках, обработка отзывов и контента на китайском, японском, корейском, перевод и локализация — здесь Qwen чувствует себя увереннее западных моделей сопоставимой цены. Если у вашего продукта есть азиатская аудитория или мультиязычный поток данных, Qwen стоит включить в short-list кандидатов и проверить на реальной выборке.
Гибридная схема
На практике многие команды строят гибрид: Qwen (или DeepSeek) — на потоке простых и средних задач, где важны объём и цена, а дорогой флагман подключают точечно, только на запросах, где он реально нужен. Поскольку всё работает через один OpenAI-совместимый интерфейс, переключение между моделями — это смена значения поля model. Развёрнутое сравнение моделей по сценариям мы собрали в обзоре топ-5 LLM 2026, а если нужен именно GPT с рублёвой оплатой — он подключается так же, см. страницу доступа к ChatGPT API.
Практический совет тот же, что и для флагманов: возьмите репрезентативную выборку ваших реальных запросов, прогоните на двух-трёх кандидатах и сравните не только цену, но и качество ответа на вашем классе задач и языке. OpenAI-совместимый протокол делает такой A/B-тест вопросом смены одной строки.
Оплата и документы для юр.лица
Для команд в компаниях важна не только цена токена, но и то, как эти расходы проходят по бухгалтерии. Promptra принимает оплату на юр.лицо российское юр.лицо рублёвой платёжкой с расчётного счёта, с полным пакетом закрывающих документов через ЭДО — договор-оферта, счёт, акт, счёт-фактура, УПД. Документооборот идёт через операторов ЭДО (Диадок, СБИС, Контур), что удобно для корпоративной бухгалтерии: документы автоматически проводятся в учётной системе. Валютный контроль не нужен — это рублёвый договор с резидентом РФ.
С Qwen этот аргумент особенно практичен. Прямой доступ к DashScope из России — это зарубежная карта, валютный платёж и отсутствие закрывающих документов российского формата: расход сложно корректно учесть. Через Promptra вы получаете ту же модель по той же цене (1-в-1 с прайсом Alibaba по курсу ЦБ), но платите в рублях и с первичкой, которую без вопросов примет ваша бухгалтерия. Любой бухгалтер и налоговый инспектор смотрят в первую очередь на документы — и здесь у вас полный комплект. Что именно принимается к учёту при работе с зарубежными LLM через российское юр.лицо, мы разобрали в гайде легально ли использовать AI API на юр.лицо.
Promptra — Russian LLM API aggregator. One OpenAI-compatible endpoint to all flagship models: OpenAI (GPT-5.5, GPT-5.4), Anthropic (Claude Opus 4.7, Sonnet 4.6), Google (Gemini 3.1 Pro, 3.5 Flash), DeepSeek V4 Pro, Qwen 3.6 Plus.
Provider prices 1-to-1 at CBR rate — no markup on tokens. Ruble billing per contract, full closing documents through EDI. No VPN — legal B2B service in Russia.
Try: promptra.ru · model catalog · docs




Top comments (0)