DEV Community

Promptra Team for Promptra

Posted on

Qwen в России: как пользоваться и подключить по API

Два пути доступа к Qwen из России: прямой доступ к Alibaba DashScope с барьерами оплаты и стабильный маршрут через OpenAI-совместимый API с оплатой в рублях

Коротко: пользоваться Qwen из России в 2026 году можно, и платить за это можно в рублях на юридическое лицо. Qwen — это семейство языковых моделей Alibaba (китайское имя — Tongyi Qianwen), и его старшая модель текущего поколения, Qwen 3.6 Plus, доступна из РФ через API-агрегатор с OpenAI-совместимым endpoint. В коде меняется один параметр — base_url на https://api.promptra.ru/v1 — а оплата идёт рублёвой платёжкой, а не зарубежной картой. Это не обход блокировок и не VPN: запрос уходит на российский endpoint, агрегатор проксирует его в Qwen от своего имени, а вы получаете результат, рублёвый счёт и закрывающие документы. Цена — 1-в-1 с прайсом Alibaba DashScope по курсу ЦБ: 20 ₽ за 1M входных токенов и 130 ₽ за 1M выходных.

Чем Qwen интересен российскому разработчику в двух словах: это многоязычная open-weight модель (сильная в азиатских языках и коде), с окном контекста на 1 миллион токенов, и при этом одна из самых дешёвых на рынке по входным токенам. Этот материал разбирает обе стороны вопроса: что такое Qwen и какие модели в линейке, в чём его сильные стороны, почему прямой доступ из РФ затруднён, и как именно подключить Qwen по API за пять минут — с рабочим кодом, ценой в рублях из каталога и FAQ. Все цены — на 2026-05-29.

Что такое Qwen и какие модели в линейке

Qwen — это семейство больших языковых моделей, которое разрабатывает Alibaba Cloud. В китайском оригинале линейка называется Tongyi Qianwen, в международной версии — просто Qwen. Существует она с 2023 года и за это время выросла в одну из самых заметных open-weight экосистем мира: десятки моделей разного размера — от компактных, помещающихся на ноутбук, до флагманских, — плюс специализированные версии под код, математику и работу с изображениями.

Для пользователя из России важно различать две вещи под одним именем Qwen, ровно как и у других провайдеров. Есть потребительский чат (веб-приложение и мобильное приложение Qwen, бывший чат Tongyi) — это продукт для конечного пользователя. И есть API-модели, которые разработчик встраивает в свой код или сервис. Доступность у них разная, и в этом материале нас интересует именно API — то, на что можно опереться в работе.

Старшая модель текущего поколения в нашем каталоге — Qwen 3.6 Plus. Это «плюс»-модель, рассчитанная на широкий спектр задач при низкой цене. Помимо неё, линейка Qwen включает целый спектр вариантов: компактные модели для локального запуска, отдельные ветки под код (Qwen Coder), под рассуждения и под мультимодальность (Qwen-VL для изображений). На рынке Qwen известен прежде всего двумя вещами — открытыми весами и сильной многоязычностью, особенно за пределами английского.

Ключевые характеристики Qwen 3.6 Plus из нашего каталога:

Параметр Значение
Идентификатор модели qwen/qwen3.6-plus
Провайдер Alibaba Qwen (Tongyi Qianwen)
Тип весов open-weight (открытая лицензия)
Контекстное окно 1 000 000 токенов
Максимум на выход 65 536 токенов
Модальности входа текст
Модальности выхода текст
Endpoint chat (OpenAI-совместимый)

Миллион токенов контекста — это ориентировочно 700–750 тысяч слов или порядка 50 000 строк кода. В одно окно влезает кодовая база среднего сервиса, объёмный архив документов или длинная история диалога целиком. Если вам нужен глубокий разбор именно Qwen 3.6 Plus — бенчмарки цены, тарификация по длине контекста, детальное сравнение с DeepSeek и GLM — он в отдельном материале про Qwen 3.6 Plus API за рубли. Здесь же фокус на главном вопросе: как получить доступ к Qwen из России.

Линейка Qwen с подписями на русском: семейство моделей Alibaba — Qwen 3.6 Plus, Coder, VL, компактные версии — и карточка Qwen 3.6 Plus с числами: контекст 1 000 000 токенов, выход 65 536, вход 20 рублей за 1М, выход 130 рублей за 1М

Сильные стороны Qwen: многоязычность, цена и код

Почему вообще стоит присматриваться к Qwen среди десятков моделей? У линейки есть три черты, которые делают её отдельным инструментом, а не «ещё одной большой LLM».

Многоязычность — главная сила. Qwen традиционно силён за пределами английского. Китайский, японский, корейский и другие азиатские языки модель обрабатывает заметно лучше, чем большинство западных моделей сопоставимой цены — это прямое следствие того, что её обучала китайская компания на корпусе с большой долей азиатских языков. Русский Qwen тоже поддерживает: для повседневных задач (резюмирование, классификация, извлечение данных, генерация описаний) качества достаточно. Если ваш продукт работает с мультиязычным контентом или ориентирован на азиатские рынки, Qwen — естественный кандидат.

Низкая цена, особенно на входе. Qwen 3.6 Plus стоит 20 ₽ за 1M входных токенов — это одна из самых низких ставок входа во всём каталоге, в 17 с лишним раз дешевле флагманов вроде GPT-5.5. Причина в открытых весах: модель отдаёт не только сама Alibaba через DashScope, но и десятки независимых инференс-провайдеров, и конкуренция между ними держит цену низкой. По той же причине дёшев и DeepSeek. Для нагрузок, где много входного контекста и короткий ответ — классификация, извлечение полей, RAG-ответы по большой базе — это почти идеальный профиль: вы платите символически за то, что модель «прочитала» большой контекст.

Код и инструментальные задачи. Внутри семейства есть отдельная сильная ветка под программирование (Qwen Coder), и сам Qwen 3.6 Plus неплохо справляется с генерацией и разбором кода. Alibaba позиционирует поколение 3.6 как шаг в сторону «агентных» сценариев — работы с инструментами и многошаговых задач; подробности компания описывает в блоге Alibaba Cloud о Qwen3.6-Plus.

Где Qwen не первый выбор — это задачи на предельно сложный reasoning и длинные агентные циклы, где цена ошибки выше цены токенов: в эту нишу чаще берут западные флагманы (Claude, GPT-5.5). Но для массовых задач средней сложности, многоязычной обработки и всего, где важен объём при разумной цене, Qwen — рациональный выбор.

Карточка сильных сторон Qwen с подписями на русском: три блока — многоязычность (китайский, японский, корейский, русский), низкая цена входа 20 рублей за 1М токенов, код и агентные задачи; терракотовые акценты на бежевом фоне

Почему прямой доступ к Qwen из России затруднён

«Qwen в России» — это, как и у других зарубежных провайдеров, два разных вопроса с разными ответами. Доступ к потребительскому приложению и доступ к API устроены по-разному и упираются в разные ограничения.

Приложение и личный кабинет DashScope

Потребительский чат Qwen и консоль Alibaba Cloud Model Studio (платформа DashScope, через которую Alibaba отдаёт модели) рассчитаны на свои регионы и платёжные системы. Из России регистрация спотыкается о привычные барьеры: верификация аккаунта Alibaba Cloud требует данных и платёжных реквизитов, которые российскому пользователю трудно предоставить, а часть функций завязана на китайскую или международную платёжную инфраструктуру. Сам сайт при этом обычно открывается — проблема не в доступности страницы, а в том, что пройти регистрацию и довести дело до оплаты не получается.

Оплата — главный барьер

Ключевая стена — деньги. У Alibaba Cloud собственная платёжная платформа, рассчитанная на международные карты и китайские платёжные системы. Когда российский пользователь доходит до пополнения баланса DashScope, он упирается в типичные барьеры:

  • Карта не проходит. Карты МИР зарубежными эквайрингами не принимаются в принципе, а российские Visa/Mastercard после 2022 года не работают за пределами РФ. Пополнить долларовый или юаневый баланс DashScope такой картой не выйдет.
  • Нет рублёвого счёта и документов. Даже если оплата как-то проходит через зарубежную виртуальную карту, вы получаете списание в валюте без российских закрывающих документов. Для компании это означает, что расход нельзя корректно провести в учёте.
  • Валютный платёж юрлица — отдельная история. Прямой платёж российской компании иностранному поставщику требует основания (контракт, инвойс) и проходит через валютный контроль банка. Городить эту схему ради API-подписки на несколько тысяч рублей в месяц экономически бессмысленно.

Дальше обычно идут два народных пути, и у обоих есть честные минусы. Зарубежная виртуальная карта (VCC): вы пополняете её в рублях, она выпускает Visa/Mastercard в долларах, вы привязываете её к DashScope. Минусы — курс конвертации выше биржевого (типичная наценка 4–7%), комиссии за выпуск и пополнение, и главное — никаких закрывающих документов. Запуск весов у себя: Qwen open-weight, теоретически модель можно скачать и хостить локально, но для версии уровня 3.6 Plus нужен серьёзный GPU-кластер, инженер по инференсу и постоянное обслуживание — для команды, которой нужно просто «дёргать модель из кода», это несоразмерные затраты.

Важно про формулировки

Речь не про «обход блокировок» и не про серые схемы. API можно легально проксировать через посредника: агрегатор с юр.лицом в поддерживаемом регионе делает запрос к Qwen от своего имени и отдаёт вам результат через российский endpoint с рублёвой оплатой. С точки зрения Alibaba — это его легальный клиент, соблюдающий условия. С точки зрения российского пользователя — это сервис с договором, документами и поддержкой на русском. Никакого VPN, никакой зарубежной карты, никакого аккаунта в DashScope на вашей стороне. Именно поэтому предсказуемый способ работать с Qwen из России — это API через агрегатор.

Сравнение трёх путей доступа к Qwen из России с подписями на русском: зарубежная карта VCC (наценка 4-7 процентов, нет документов), свой хостинг open-weight (дорого, нужен GPU-кластер), агрегатор (рубли, документы, тот же протокол) — последний блок выделен терракотовым

Как пользоваться Qwen в России через API: пошагово

Самый практичный способ работать с Qwen из России — не нативный SDK Alibaba, а OpenAI-совместимый endpoint. Это не случайность и не костыль агрегатора: сама Alibaba отдаёт Qwen через OpenAI-совместимый режим DashScope и в своей документации прямо рекомендует мигрировать с OpenAI-кода, поменяв ключ, base_url и имя модели. Promptra принимает запросы в формате OpenAI Chat Completions и сам транслирует их в Qwen — значит, весь существующий код на openai SDK работает без переписывания. Разберём по шагам.

Шаг 1. Получить ключ. Регистрируетесь на стороне агрегатора (на Promptra достаточно телефона — без email и зарубежной верификации) и получаете API-ключ вида prm-....

Шаг 2. Пополнить баланс в рублях. Оплата идёт рублёвой платёжкой. Цена за токены — один-в-один с прайсом Alibaba по курсу ЦБ, без наценки на токены. Сервисная комиссия 5% берётся только при пополнении баланса, а не от токенов.

Шаг 3. Поменять base_url в коде. Это вся «миграция». Вместо адреса DashScope вы указываете российский endpoint и модель qwen/qwen3.6-plus.

Шаг 4. Сделать запрос. Дальше код работает как обычно — модель отвечает, вы получаете результат.

Вот рабочий пример на Python. Клиент — стандартный openai, меняется только base_url, ключ и имя модели:

from openai import OpenAI

client = OpenAI(
 api_key="prm-xxxxxxxxxxxx", # ключ Promptra
 base_url="https://api.promptra.ru/v1", # единственное изменение
)

response = client.chat.completions.create(
 model="qwen/qwen3.6-plus",
 messages=[
 {"role": "system", "content": "Ты — ассистент по извлечению данных. Отвечай строго JSON."},
 {"role": "user", "content": "Извлеки ИНН и сумму из текста договора:..."},
 ],
)

print(response.choices[0].message.content)
Enter fullscreen mode Exit fullscreen mode

То же самое на Node.js:

import OpenAI from "openai";

const client = new OpenAI({
 apiKey: process.env.PROMPTRA_API_KEY,
 baseURL: "https://api.promptra.ru/v1", // единственное изменение
});

const response = await client.chat.completions.create({
 model: "qwen/qwen3.6-plus",
 messages: [
 { role: "user", content: "Классифицируй обращение по категории:..." },
 ],
});

console.log(response.choices[0].message.content);
Enter fullscreen mode Exit fullscreen mode

Хранить base_url в переменной окружения

Хорошая практика для продакшена — держать base_url и ключ в .env, а не зашивать в код. Тогда переключиться между моделями (или на fallback) можно за секунду, без передеплоя:

import os
from openai import OpenAI

# В.env:
# OPENAI_API_KEY=prm-xxxxxxxxxxxx
# OPENAI_BASE_URL=https://api.promptra.ru/v1

client = OpenAI(
 api_key=os.environ["OPENAI_API_KEY"],
 base_url=os.environ["OPENAI_BASE_URL"],
)

response = client.chat.completions.create(
 model="qwen/qwen3.6-plus",
 messages=[{"role": "user", "content": "Привет"}],
)
Enter fullscreen mode Exit fullscreen mode

Проверить, что подключение работает, можно одним curl-запросом без всякого SDK:

curl https://api.promptra.ru/v1/chat/completions \
 -H "Authorization: Bearer prm-xxxxxxxxxxxx" \
 -H "Content-Type: application/json" \
 -d '{
 "model": "qwen/qwen3.6-plus",
 "messages": [{"role": "user", "content": "ping"}]
 }'
Enter fullscreen mode Exit fullscreen mode

Если в ответ пришёл JSON с полем choices — модель отвечает, можно подключать в продакшен. Если вы раньше ходили в DashScope напрямую, миграция сводится к замене адреса и имени модели на формат каталога — поля запроса остаются прежними. Общий разбор смены base_url на разных языках — в материале про миграцию с OpenAI SDK. Удобство OpenAI-совместимого протокола в том, что одну и ту же кодовую базу можно перенаправить с Qwen на DeepSeek или флагман сменой одной строки model — без переписывания интеграции.

Цена Qwen в рублях

Promptra не накручивает наценку на токены. Стоимость модели равна официальному прайсу Alibaba DashScope, пересчитанному в рубли по курсу ЦБ РФ на 2026-05-27: 1 USD = 71.668 ₽. Рублёвые значения округлены вниз (правило каталога). Базовый прайс публикуется на странице цен Alibaba Cloud Model Studio; ставка по конкретной версии 3.6 Plus также сверяется по листингу openrouter.ai/qwen.

Тип токенов Цена DashScope (USD за 1M) Цена Promptra (₽ за 1M)
Вход (input) $0.325 20 ₽
Выход (output) $1.95 130 ₽

Точная арифметика: $0.325 × 71.668 ≈ 23.3 ₽, $1.95 × 71.668 ≈ 139.8 ₽. В каталоге значения округлены вниз до 20 и 130 ₽; фактический счёт считается по курсу ЦБ на день пополнения, поэтому в разные дни рублёвая цифра слегка плавает вслед за курсом, а долларовая ставка остаётся фиксированной.

Чтобы понять масштаб на фоне флагманов: вход Qwen дешевле GPT-5.5 в 17.5 раза (20 ₽ против 350 ₽), а выход — в 16.5 раза (130 ₽ против 2150 ₽). При этом контекст у Qwen такой же — 1M токенов. Сравнение по входу и выходу с другими моделями каталога:

Модель Вход (₽/1M) Выход (₽/1M) Контекст
Qwen 3.6 Plus 20 ₽ 130 ₽ 1M
DeepSeek V4 Pro (промо) 30 ₽ 60 ₽ 1M
GLM 5.1 100 ₽ 310 ₽ около 203K
Gemini 3.1 Pro Preview 140 ₽ 860 ₽ 1M
Claude Opus 4.7 350 ₽ 1790 ₽ 1M
GPT-5.5 350 ₽ 2150 ₽ 1.05M

Чтобы цена за миллион токенов превратилась в понятный порядок расходов, прикинем типовые сценарии. Считается всё просто: (входные_токены / 1 000 000 × 20) + (выходные_токены / 1 000 000 × 130).

Сценарий Вход Выход Стоимость
Короткий чат-запрос 1K 0.5K около 0.085 ₽
Классификация документа 20K 0.3K около 0.44 ₽
RAG-ответ по базе знаний 80K 2K около 1.86 ₽
Анализ кода на 50K токенов 50K 4K около 1.52 ₽

Обратите внимание на масштаб: RAG-ответ с контекстом на 80 тысяч токенов обходится менее чем в 2 ₽ — на флагманах такой же запрос стоил бы десятки рублей. Это и есть основной аргумент в пользу Qwen на массовых задачах.

Отдельный нюанс линейки Qwen: у моделей Alibaba исторически тарификация может зависеть от длины контекста и режима (обычная генерация против «думающего» reasoning-режима). На официальной странице цен старшие Qwen-модели разбиты на тарифные диапазоны. В нашем каталоге для qwen/qwen3.6-plus зафиксирована единая ставка 20/130 ₽, которая и применяется к запросам через Promptra; если вы строите пайплайн с очень длинным контекстом или reasoning-режимом, имеет смысл свериться с официальным прайсом Alibaba по конкретному сценарию — мы не выдумываем пороги, а отсылаем к первоисточнику.

Сценарии: где Qwen раскрывается лучше всего

Qwen — не универсальная замена всему. Он силён в конкретных сценариях и слабее в других. Коротко, чтобы не тратить бюджет зря.

Массовый объём: дешёвый вход решает

Главный экономический сюжет Qwen — очень дешёвый вход (20 ₽/1M) при умеренном выходе (130 ₽/1M). Это делает его оптимальным там, где входного контекста много, а выход короткий:

  • Классификация и маршрутизация. На вход — текст обращения, документа, тикета; на выход — короткая метка категории. Вход длинный, выход — несколько токенов.
  • Извлечение полей (extraction). На вход — договор, инвойс, резюме; на выход — структурированный JSON. Выход в разы короче входа.
  • RAG-ответы. На вход — вопрос плюс извлечённые фрагменты базы знаний (часто десятки тысяч токенов); на выход — короткий ответ по существу.
  • Модерация и скоринг. На вход — контент; на выход — оценка или флаг.

На потоке в миллионы запросов 17-кратная разница в цене входа против флагманов превращается в принципиально иной порядок расходов. Если же задача генеративная (длинные тексты, развёрнутые отчёты, большой output), асимметрия работает слабее, и стоит присмотреться к DeepSeek в России с его более дешёвым выходом — это соседняя дешёвая open-weight модель, доступная через тот же endpoint.

Многоязычные задачи

Второй естественный сценарий — всё, что связано с языками за пределами английского и русского. Поддержка клиентов на азиатских рынках, обработка отзывов и контента на китайском, японском, корейском, перевод и локализация — здесь Qwen чувствует себя увереннее западных моделей сопоставимой цены. Если у вашего продукта есть азиатская аудитория или мультиязычный поток данных, Qwen стоит включить в short-list кандидатов и проверить на реальной выборке.

Гибридная схема

На практике многие команды строят гибрид: Qwen (или DeepSeek) — на потоке простых и средних задач, где важны объём и цена, а дорогой флагман подключают точечно, только на запросах, где он реально нужен. Поскольку всё работает через один OpenAI-совместимый интерфейс, переключение между моделями — это смена значения поля model. Развёрнутое сравнение моделей по сценариям мы собрали в обзоре топ-5 LLM 2026, а если нужен именно GPT с рублёвой оплатой — он подключается так же, см. страницу доступа к ChatGPT API.

Практический совет тот же, что и для флагманов: возьмите репрезентативную выборку ваших реальных запросов, прогоните на двух-трёх кандидатах и сравните не только цену, но и качество ответа на вашем классе задач и языке. OpenAI-совместимый протокол делает такой A/B-тест вопросом смены одной строки.

Оплата и документы для юр.лица

Для команд в компаниях важна не только цена токена, но и то, как эти расходы проходят по бухгалтерии. Promptra принимает оплату на юр.лицо российское юр.лицо рублёвой платёжкой с расчётного счёта, с полным пакетом закрывающих документов через ЭДО — договор-оферта, счёт, акт, счёт-фактура, УПД. Документооборот идёт через операторов ЭДО (Диадок, СБИС, Контур), что удобно для корпоративной бухгалтерии: документы автоматически проводятся в учётной системе. Валютный контроль не нужен — это рублёвый договор с резидентом РФ.

С Qwen этот аргумент особенно практичен. Прямой доступ к DashScope из России — это зарубежная карта, валютный платёж и отсутствие закрывающих документов российского формата: расход сложно корректно учесть. Через Promptra вы получаете ту же модель по той же цене (1-в-1 с прайсом Alibaba по курсу ЦБ), но платите в рублях и с первичкой, которую без вопросов примет ваша бухгалтерия. Любой бухгалтер и налоговый инспектор смотрят в первую очередь на документы — и здесь у вас полный комплект. Что именно принимается к учёту при работе с зарубежными LLM через российское юр.лицо, мы разобрали в гайде легально ли использовать AI API на юр.лицо.


Promptra — Russian LLM API aggregator. One OpenAI-compatible endpoint to all flagship models: OpenAI (GPT-5.5, GPT-5.4), Anthropic (Claude Opus 4.7, Sonnet 4.6), Google (Gemini 3.1 Pro, 3.5 Flash), DeepSeek V4 Pro, Qwen 3.6 Plus.

Provider prices 1-to-1 at CBR rate — no markup on tokens. Ruble billing per contract, full closing documents through EDI. No VPN — legal B2B service in Russia.

Try: promptra.ru · model catalog · docs

Top comments (0)