DEV Community

Promptra Team for Promptra

Posted on

Генерация изображений по API: Nano Banana Pro и GPT Image 2

Схема пайплайна text-to-image: текстовый промпт разработчика входит в единый OpenAI-совместимый шлюз и расходится к двум флагманским моделям генерации изображений — Nano Banana Pro и GPT Image 2

Сгенерировать изображение по API из России можно через два флагманских движка — Google Nano Banana Pro и OpenAI GPT Image 2 — и оба доступны через один OpenAI-совместимый endpoint Promptra. В коде вы вызываете стандартный метод images.generations, меняете base_url на https://api.promptra.ru/v1 и указываете нужную модель (google/nano-banana-pro или openai/gpt-image-2). VPN и зарубежные карты не нужны: запросы проксируются легально, а оплата идёт на российское юр.лицо с полным пакетом закрывающих документов через ЭДО.

Обе модели — это генерация картинки из текстового описания (text-to-image), плюс у каждой есть отдельный режим редактирования (image edit / inpainting), который принимает на вход исходное изображение. Тарификация у обоих провайдеров по токенам, и точную стоимость одной генерации в рублях мы намеренно не фиксируем цифрой в этой статье — она зависит от размера и качества изображения и регулярно пересматривается провайдерами. Актуальные ставки всегда смотрите на официальных страницах Google Gemini API pricing и OpenAI pricing; Promptra считает по этим же ставкам по курсу ЦБ, без наценки на токены.

Ниже разберём, чем Nano Banana Pro отличается от GPT Image 2 по сильным сторонам и режимам, для каких задач какую модель брать (продуктовые фото, баннеры, контент, ассеты для интерфейсов), как именно вызвать генерацию и редактирование из Python и Node.js, и как устроена оплата для команды в компании. Все факты по моделям — из нашего каталога на 29.05.2026.

Что такое API генерации изображений и зачем он команде

API генерации изображений — это способ получать картинки программно, по HTTP-запросу, без ручного клика в веб-интерфейсе. Вы отправляете текстовый промпт (а для режима редактирования — ещё и исходное изображение), а в ответ получаете готовый файл. Это принципиально другой сценарий, чем «зашёл в чат-бот и попросил картинку»: API встраивается в продукт и работает на потоке. Подробнее — актуальные тарифы LLM в рублях с разбивкой по моделям.

Где это реально нужно бизнесу:

  • Продуктовые фото и карточки товаров — генерация и доработка предметной съёмки, фоны, ракурсы, сезонные вариации для маркетплейсов.
  • Рекламные баннеры и креативы — массовое производство вариаций под A/B-тесты, форматы под разные площадки, локализация визуала.
  • Контент для медиа и соцсетей — иллюстрации к статьям, обложки, инфографика, превью.
  • Ассеты для интерфейсов и игр — иконки, текстуры, иллюстрации состояний, заглушки, концепт-арт.
  • Внутренние пайплайны — автоматическая генерация изображений по данным (например, превью к товарам из каталога или персонализированные визуалы под сегмент).

Ключевое отличие API от ручной генерации — повторяемость и масштаб. Одна картинка раз в неделю — проще открыть веб-интерфейс. Сто картинок в день по шаблону, встроенных в сервис, — это работа для API. И здесь важны три вещи: какая модель лучше справляется с вашим типом задач, как стабильно обращаться к ней из России и как корректно провести расходы по бухгалтерии.

Карта применения API генерации изображений: центральный блок «text-to-image API» со стрелками к пяти подписанным прямоугольникам — продуктовые фото, рекламные баннеры, контент для медиа, ассеты для интерфейсов, внутренние пайплайны, тёплая бежевая палитра с терракотовыми акцентами

Nano Banana Pro: флагман генерации изображений от Google

Nano Banana Pro — старшая модель генерации изображений в линейке Google, технически это высокотиерная версия Gemini Image. В нашем каталоге она помечена как флагман (isFlagship: true). Из подтверждённых характеристик:

Параметр Значение
Идентификатор модели google/nano-banana-pro
Провайдер Google
Модальность изображение (image)
Вход текст
Выход изображение
Endpoints chat, images_generations
Тарификация по токенам (см. официальный прайс Google)

Сильные стороны Nano Banana Pro относительно базовой версии — выше разрешение и лучше детализация: проработка мелких деталей, чистая геометрия, аккуратные края. У линейки Gemini Image поддерживаются разные размеры вывода вплоть до высоких разрешений, и в нашем каталоге для Pro отмечено, что тарификация по выходным размерам 1K и 2K совпадает — то есть переход на более крупный формат в этих пределах не всегда означает рост цены за изображение. Точные размеры, лимиты и ставки — в документации Gemini API по генерации изображений и на странице цен.

Для редактирования у Google есть отдельная модель — Nano Banana Pro Edit (google/nano-banana-pro-edit). Она принимает на вход исходное изображение плюс текст и доступна через дополнительный endpoint images_edits. Это режим «сложные правки с сохранением деталей»: заменить объект, изменить фон, дорисовать область, не разрушив остальную картинку. Отдельного прайса на редактирование Google не публикует — правки тарифицируются по тем же токенным ставкам, что и генерация.

Когда брать Nano Banana Pro: задачи, где важна детализация и аккуратность изображения, а также сценарии, где у вас уже есть стек на Google/Gemini и хочется остаться в одной экосистеме. Базовая Nano Banana (не Pro) — вариант, когда нужна более быстрая и дешёвая генерация без требований к максимальному качеству.

GPT Image 2: флагман генерации изображений от OpenAI

GPT Image 2 — топовая модель OpenAI для генерации изображений по тексту. В каталоге она тоже помечена как флагман. Характеристики:

Параметр Значение
Идентификатор модели openai/gpt-image-2
Провайдер OpenAI
Модальность изображение (image)
Вход текст
Выход изображение
Контекст 272 000 токенов
Endpoints chat, images_generations
Тарификация по токенам (см. официальный прайс OpenAI)

Заметное техническое отличие GPT Image 2 от Nano Banana Pro на уровне каталога — указанный контекст в 272 000 токенов. Для генерации изображений это значит, что модель способна принять очень развёрнутый, длинный промпт с детальным описанием сцены, ограничений и стиля, не упираясь в короткий лимит ввода. Для сложных составных запросов (много объектов, точные инструкции по композиции и тексту на картинке) это полезно.

Сильная сторона GPT Image 2 — следование инструкциям и работа с текстом на изображении: модель хорошо удерживает то, что прописано в промпте, и аккуратнее многих конкурентов рисует подписи и надписи внутри картинки. Это делает её удачным выбором для баннеров и креативов, где важно, чтобы на изображении был ровно тот текст, который вы задали.

Для редактирования и инпейнтинга у OpenAI есть GPT Image 2 Edit (openai/gpt-image-2-edit): принимает исходное изображение + текст, доступна через images_edits. Это режим точечной правки — заменить часть изображения, дорисовать область по маске, изменить фрагмент. По заметке в нашем каталоге, отдельной ставки на редактирование OpenAI не публикует: правки идут по тем же токенным тарифам, но референсные изображения всегда обрабатываются в высоком качестве, поэтому на практике стоимость редактирования примерно вдвое выше базовой генерации (это оценка по гайдам OpenAI и сообщества, а не отдельный официальный тариф). Точные ставки и параметры — в гайде OpenAI по генерации изображений и на странице цен.

Сравнение двух флагманов генерации изображений: две колонки-карточки «Nano Banana Pro» (Google) и «GPT Image 2» (OpenAI) с подписанными строками — разрешение и детализация, длинный промпт до 272K у GPT Image 2, текст на изображении, режим редактирования, экосистема; галочки и акценты терракотового цвета, русские подписи

Nano Banana Pro vs GPT Image 2: чем отличаются

Прямое сравнение «по цене за картинку» здесь невозможно по-честному — обе модели тарифицируются по токенам, и провайдеры регулярно меняют ставки. Поэтому сравним по тому, что зафиксировано в каталоге и в официальной документации провайдеров.

Критерий Nano Banana Pro (Google) GPT Image 2 (OpenAI)
Идентификатор google/nano-banana-pro openai/gpt-image-2
Статус флагман флагман
Вход текст текст
Выход изображение изображение
Контекст промпта не указан в каталоге 272 000 токенов
Генерация (endpoint) images_generations images_generations
Редактирование (модель) google/nano-banana-pro-edit openai/gpt-image-2-edit
Endpoint редактирования images_edits images_edits
Тарификация по токенам, прайс Google по токенам, прайс OpenAI
Официальный прайс ai.google.dev/.../pricing developers.openai.com/.../pricing

Что из этого практически важно:

Разрешение и детализация. Nano Banana Pro позиционируется Google как «выше разрешение, лучше детализация» относительно базовой версии — это аргумент за неё там, где нужна чистая, проработанная картинка. У линейки Gemini Image есть варианты высоких размеров вывода; конкретику смотрите в документации Google.

Длина и точность промпта. У GPT Image 2 в каталоге заявлен контекст 272K токенов и сильное следование инструкциям — это аргумент за неё для сложных составных промптов и для изображений с текстом/надписями, где важна точность.

Редактирование. У обоих провайдеров режим правок реализован отдельной моделью через images_edits. У GPT Image 2 Edit референс всегда обрабатывается в высоком качестве (практически ~2× к базовой генерации по стоимости), у Nano Banana Pro Edit отдельного прайса нет — правки по ставкам генерации.

Экосистема и единый счёт. Через Promptra обе модели доступны по одному ключу и одному base_url, с единой оплатой в рублях. Это снимает главную операционную головную боль — не нужно заводить и оплачивать два разных зарубежных аккаунта (Google и OpenAI) с зарубежных карт.

Endpoints и режимы работы

Задача Nano Banana Pro GPT Image 2 Endpoint
Генерация text-to-image google/nano-banana-pro openai/gpt-image-2 /v1/images/generations
Редактирование (inpaint, замена объекта) google/nano-banana-pro-edit openai/gpt-image-2-edit /v1/images/edits
Контекст промпта не указан в каталоге 272 000 токенов
Стоимость правки vs генерации по той же ставке ×2 (референс в high quality)

Обе пары моделей подключаются одинаково: в OpenAI SDK вызываете client.images.generate(...) или client.images.edit(...) и меняете только model. Один ключ Promptra, один base_url=https://api.promptra.ru/v1, единый рублёвый биллинг.

Практический вывод: не выбирайте «лучшую модель вообще» — прогоните обе на 10–20 своих реальных промптах и сравните результат на ваших задачах. Поскольку обе доступны через один endpoint, переключение — это смена одной строки model в запросе. О том, как в принципе устроен мультимодельный доступ через единый API, мы писали в обзоре топ-5 LLM 2026.

Как вызвать генерацию изображения: images/generations

Технически генерация изображения через Promptra работает так же, как напрямую через OpenAI SDK, потому что API совместим с OpenAI на уровне протокола. Меняется один параметр — base_url, ключ заменяется на ключ Promptra, а модель выбирается в поле model.

Python — генерация

from openai import OpenAI

client = OpenAI(
 api_key="prm-xxxxxxxxxxxx", # ключ Promptra
 base_url="https://api.promptra.ru/v1", # единственное изменение
)

result = client.images.generate(
 model="openai/gpt-image-2", # или "google/nano-banana-pro"
 prompt="Минималистичный продуктовый кадр: керамическая кружка на "
 "светлом фоне, мягкий дневной свет, вид три четверти",
 size="1024x1024",
)

# В ответе — изображение (URL или base64, в зависимости от настроек).
print(result.data[0].url)
Enter fullscreen mode Exit fullscreen mode

Node.js — генерация

import OpenAI from "openai";

const client = new OpenAI({
 apiKey: "prm-xxxxxxxxxxxx",
 baseURL: "https://api.promptra.ru/v1", // единственное изменение
});

const result = await client.images.generate({
 model: "google/nano-banana-pro", // или "openai/gpt-image-2"
 prompt:
 "Рекламный баннер для распродажи: яркая геометрическая композиция, " +
 "крупная надпись «-30%», современный плоский стиль",
 size: "1024x1024",
});

console.log(result.data[0].url);
Enter fullscreen mode Exit fullscreen mode

Чтобы переключиться между моделями, меняется ровно одно поле — model. Всё остальное (ключ, endpoint, формат запроса) остаётся прежним. Это и есть смысл единого OpenAI-совместимого шлюза: вы не переписываете интеграцию под каждого провайдера.

Проверить, что доступ работает, можно одним curl-запросом без SDK:

curl https://api.promptra.ru/v1/images/generations \
 -H "Authorization: Bearer prm-xxxxxxxxxxxx" \
 -H "Content-Type: application/json" \
 -d '{
 "model": "openai/gpt-image-2",
 "prompt": "ping: простой круг на белом фоне",
 "size": "1024x1024"
 }'
Enter fullscreen mode Exit fullscreen mode

Если в ответ пришёл JSON с полем data и ссылкой (или base64) на изображение — модель отвечает, можно встраивать в продукт.

Схема вызова images/generations: блок «текстовый промпт» стрелкой к блоку «POST /v1/images/generations», далее к выбору модели (nano-banana-pro или gpt-image-2), далее к ответу «готовое изображение»; подпись «меняется только поле model», стрелки и подписи на русском, терракотовый акцент на узле выбора модели

Как редактировать изображение: images/edits и inpainting

Редактирование (image edit) и инпейнтинг (правка по маске) работают через endpoint images_edits и отдельные модели с суффиксом -edit. На вход подаётся исходное изображение (а для инпейнтинга — ещё и маска, показывающая, какую область менять) плюс текстовый промпт с описанием правки.

Python — редактирование

from openai import OpenAI

client = OpenAI(
 api_key="prm-xxxxxxxxxxxx",
 base_url="https://api.promptra.ru/v1",
)

with open("product.png", "rb") as image_file:
 result = client.images.edit(
 model="openai/gpt-image-2-edit", # или "google/nano-banana-pro-edit"
 image=image_file,
 prompt="Заменить фон на однотонный светло-серый, "
 "сохранить объект без изменений",
 size="1024x1024",
 )

print(result.data[0].url)
Enter fullscreen mode Exit fullscreen mode

Типовые сценарии редактирования:

  • Замена фона — убрать пёстрый фон карточки товара, поставить однотонный или брендовый.
  • Удаление/замена объекта — убрать лишний элемент, заменить деталь.
  • Дорисовка области (outpainting/inpainting) — расширить кадр или заполнить вырезанный фрагмент в стиле остальной картинки.
  • Локализация визуала — заменить текст на баннере на другую языковую версию, сохранив дизайн.

Важно про стоимость редактирования: у GPT Image 2 Edit референсные изображения всегда обрабатываются в высоком качестве, поэтому правка обходится дороже базовой генерации (по оценкам OpenAI и сообщества — порядка ×2). У Nano Banana Pro Edit отдельного тарифа нет — правки идут по ставкам генерации. Точные параметры (поддержка масок, форматы, лимиты размеров) — в официальной документации: OpenAI image generation guide и Google Gemini image docs.

Сколько это стоит: честно про цену в рублях

Мы намеренно не называем цифру «N рублей за картинку». Причина простая: у обеих моделей тарификация по токенам, стоимость одной генерации зависит от размера и качества изображения, а провайдеры регулярно пересматривают ставки. Любая «фиксированная цена за изображение» быстро устаревает. Поэтому правильный источник цифр — официальные прайс-листы:

Как считает Promptra: по ставкам провайдера, пересчитанным в рубли по курсу ЦБ РФ, без наценки на токены. Сервисная комиссия 5% берётся только при пополнении баланса, а не с каждой генерации. То есть себестоимость картинки для вас равна тарифу Google или OpenAI в рублёвом эквиваленте — ровно столько, сколько вы заплатили бы напрямую провайдеру, если бы у вас была такая возможность из России.

Для сравнения: текстовые модели в каталоге имеют зафиксированную рублёвую цену за миллион токенов (например, GPT-5.5 — 350/2150 ₽ за 1M вход/выход), потому что их ставки стабильны и публикуются в долларах напрямую. У image-моделей ценообразование завязано на размер изображения, поэтому корректнее ориентироваться на актуальный официальный прайс, а стоимость под вашу нагрузку — посчитать заранее.

Тот же подход «цена 1-в-1 с провайдером» работает и для видео-моделей: про API генерации видео (Veo, Seedance, Kling) из России мы написали отдельный разбор — видео по API из России.

Какую модель выбрать под задачу

Сведём рекомендации в таблицу — не как «рейтинг лучшей модели», а как подсказку под тип задачи. Любой выбор стоит проверить на своих реальных промптах.

Задача Что важно Скорее подойдёт
Продуктовые фото, карточки товаров детализация, чистый фон, аккуратные края Nano Banana Pro (+ Edit для фона)
Баннеры и креативы с текстом точная надпись на картинке, следование промпту GPT Image 2
Иллюстрации к статьям и контент разнообразие, скорость на потоке обе; базовая Nano Banana — дешевле
Сложный составной промпт длинный детальный ввод GPT Image 2 (контекст 272K)
Точечная правка готового изображения inpainting, замена объекта GPT Image 2 Edit / Nano Banana Pro Edit
Уже есть стек на Google единая экосистема Nano Banana Pro
Уже есть стек на OpenAI SDK минимум изменений в коде GPT Image 2

Главный практический совет повторим: поскольку обе модели доступны через один OpenAI-совместимый endpoint и один ключ, переключение между ними — это смена одной строки. Поэтому разумная стратегия — не выбирать заранее «навсегда», а гонять обе на своих задачах и оставлять ту, что стабильно даёт лучший результат именно у вас. А на разные подзадачи можно держать разные модели одновременно: например, GPT Image 2 на баннеры с текстом и Nano Banana Pro на продуктовую детализацию.

Дерево решения выбора модели генерации изображений: от корневого вопроса «что генерируем» ветви к блокам — баннер с текстом → GPT Image 2, продуктовое фото → Nano Banana Pro, правка готового → Edit-модели, длинный промпт → GPT Image 2; подписи на русском, блоки тёплой палитры с терракотовыми акцентами

Доступ из России без VPN и оплата на юр.лицо

Прямой доступ к Google Gemini и OpenAI из России затруднён: нужны зарубежные карты для оплаты, VPN для обхода ограничений, а аккаунты живут до первого бана. Для разового эксперимента это может сработать, но для продукта, который генерирует изображения на потоке, такой путь ненадёжен — в любой момент можно остаться без доступа и без корректных документов на расход.

Через Promptra обе модели — Nano Banana Pro и GPT Image 2 — доступны по одному ключу через российский OpenAI-совместимый endpoint. VPN не требуется: запросы проксируются легально на стороне сервиса. Оплата идёт на российское юр.лицо — российское юр.лицо — с полным пакетом закрывающих документов: договор-оферта, счёт, акт, счёт-фактура, УПД. Документооборот ведётся через ЭДО (Диадок, СБИС), поэтому документы автоматически проводятся в учётной системе компании.

Для команды это снимает две проблемы. Операционную: один счёт и один ключ вместо двух зарубежных аккаунтов (Google + OpenAI) с зарубежными картами. И бухгалтерскую: расходы на генерацию изображений можно корректно учесть как затраты компании, потому что на руках есть первичка российского формата. Без правильно оформленных закрывающих документов расход сложно провести по учёту — подробно эту тему мы разобрали в гайде про закрывающие документы на AI и в материале о легальности использования зарубежных LLM на юрлицо.


Promptra — Russian LLM API aggregator. One OpenAI-compatible endpoint to all flagship models: OpenAI (GPT-5.5, GPT-5.4), Anthropic (Claude Opus 4.7, Sonnet 4.6), Google (Gemini 3.1 Pro, 3.5 Flash), DeepSeek V4 Pro, Qwen 3.6 Plus.

Provider prices 1-to-1 at CBR rate — no markup on tokens. Ruble billing per contract, full closing documents through EDI. No VPN — legal B2B service in Russia.

Try: promptra.ru · model catalog · docs

Top comments (0)