Promptra Team for Promptra

Posted on Jun 9

Генерация изображений по API: Nano Banana Pro и GPT Image 2

#nanobanana #gptimage2 #imageapi #google

Сгенерировать изображение по API из России можно через два флагманских движка — Google Nano Banana Pro и OpenAI GPT Image 2 — и оба доступны через один OpenAI-совместимый endpoint Promptra. В коде вы вызываете стандартный метод images.generations, меняете base_url на https://api.promptra.ru/v1 и указываете нужную модель (google/nano-banana-pro или openai/gpt-image-2). VPN и зарубежные карты не нужны: запросы проксируются легально, а оплата идёт на российское юр.лицо с полным пакетом закрывающих документов через ЭДО.

Обе модели — это генерация картинки из текстового описания (text-to-image), плюс у каждой есть отдельный режим редактирования (image edit / inpainting), который принимает на вход исходное изображение. Тарификация у обоих провайдеров по токенам, и точную стоимость одной генерации в рублях мы намеренно не фиксируем цифрой в этой статье — она зависит от размера и качества изображения и регулярно пересматривается провайдерами. Актуальные ставки всегда смотрите на официальных страницах Google Gemini API pricing и OpenAI pricing; Promptra считает по этим же ставкам по курсу ЦБ, без наценки на токены.

Ниже разберём, чем Nano Banana Pro отличается от GPT Image 2 по сильным сторонам и режимам, для каких задач какую модель брать (продуктовые фото, баннеры, контент, ассеты для интерфейсов), как именно вызвать генерацию и редактирование из Python и Node.js, и как устроена оплата для команды в компании. Все факты по моделям — из нашего каталога на 29.05.2026.

Что такое API генерации изображений и зачем он команде

API генерации изображений — это способ получать картинки программно, по HTTP-запросу, без ручного клика в веб-интерфейсе. Вы отправляете текстовый промпт (а для режима редактирования — ещё и исходное изображение), а в ответ получаете готовый файл. Это принципиально другой сценарий, чем «зашёл в чат-бот и попросил картинку»: API встраивается в продукт и работает на потоке. Подробнее — актуальные тарифы LLM в рублях с разбивкой по моделям.

Где это реально нужно бизнесу:

Продуктовые фото и карточки товаров — генерация и доработка предметной съёмки, фоны, ракурсы, сезонные вариации для маркетплейсов.
Рекламные баннеры и креативы — массовое производство вариаций под A/B-тесты, форматы под разные площадки, локализация визуала.
Контент для медиа и соцсетей — иллюстрации к статьям, обложки, инфографика, превью.
Ассеты для интерфейсов и игр — иконки, текстуры, иллюстрации состояний, заглушки, концепт-арт.
Внутренние пайплайны — автоматическая генерация изображений по данным (например, превью к товарам из каталога или персонализированные визуалы под сегмент).

Ключевое отличие API от ручной генерации — повторяемость и масштаб. Одна картинка раз в неделю — проще открыть веб-интерфейс. Сто картинок в день по шаблону, встроенных в сервис, — это работа для API. И здесь важны три вещи: какая модель лучше справляется с вашим типом задач, как стабильно обращаться к ней из России и как корректно провести расходы по бухгалтерии.

Nano Banana Pro: флагман генерации изображений от Google

Nano Banana Pro — старшая модель генерации изображений в линейке Google, технически это высокотиерная версия Gemini Image. В нашем каталоге она помечена как флагман (isFlagship: true). Из подтверждённых характеристик:

Параметр	Значение
Идентификатор модели	`google/nano-banana-pro`
Провайдер	Google
Модальность	изображение (image)
Вход	текст
Выход	изображение
Endpoints	`chat`, `images_generations`
Тарификация	по токенам (см. официальный прайс Google)

Сильные стороны Nano Banana Pro относительно базовой версии — выше разрешение и лучше детализация: проработка мелких деталей, чистая геометрия, аккуратные края. У линейки Gemini Image поддерживаются разные размеры вывода вплоть до высоких разрешений, и в нашем каталоге для Pro отмечено, что тарификация по выходным размерам 1K и 2K совпадает — то есть переход на более крупный формат в этих пределах не всегда означает рост цены за изображение. Точные размеры, лимиты и ставки — в документации Gemini API по генерации изображений и на странице цен.

Для редактирования у Google есть отдельная модель — Nano Banana Pro Edit (google/nano-banana-pro-edit). Она принимает на вход исходное изображение плюс текст и доступна через дополнительный endpoint images_edits. Это режим «сложные правки с сохранением деталей»: заменить объект, изменить фон, дорисовать область, не разрушив остальную картинку. Отдельного прайса на редактирование Google не публикует — правки тарифицируются по тем же токенным ставкам, что и генерация.

Когда брать Nano Banana Pro: задачи, где важна детализация и аккуратность изображения, а также сценарии, где у вас уже есть стек на Google/Gemini и хочется остаться в одной экосистеме. Базовая Nano Banana (не Pro) — вариант, когда нужна более быстрая и дешёвая генерация без требований к максимальному качеству.

GPT Image 2: флагман генерации изображений от OpenAI

GPT Image 2 — топовая модель OpenAI для генерации изображений по тексту. В каталоге она тоже помечена как флагман. Характеристики:

Параметр	Значение
Идентификатор модели	`openai/gpt-image-2`
Провайдер	OpenAI
Модальность	изображение (image)
Вход	текст
Выход	изображение
Контекст	272 000 токенов
Endpoints	`chat`, `images_generations`
Тарификация	по токенам (см. официальный прайс OpenAI)

Заметное техническое отличие GPT Image 2 от Nano Banana Pro на уровне каталога — указанный контекст в 272 000 токенов. Для генерации изображений это значит, что модель способна принять очень развёрнутый, длинный промпт с детальным описанием сцены, ограничений и стиля, не упираясь в короткий лимит ввода. Для сложных составных запросов (много объектов, точные инструкции по композиции и тексту на картинке) это полезно.

Сильная сторона GPT Image 2 — следование инструкциям и работа с текстом на изображении: модель хорошо удерживает то, что прописано в промпте, и аккуратнее многих конкурентов рисует подписи и надписи внутри картинки. Это делает её удачным выбором для баннеров и креативов, где важно, чтобы на изображении был ровно тот текст, который вы задали.

Для редактирования и инпейнтинга у OpenAI есть GPT Image 2 Edit (openai/gpt-image-2-edit): принимает исходное изображение + текст, доступна через images_edits. Это режим точечной правки — заменить часть изображения, дорисовать область по маске, изменить фрагмент. По заметке в нашем каталоге, отдельной ставки на редактирование OpenAI не публикует: правки идут по тем же токенным тарифам, но референсные изображения всегда обрабатываются в высоком качестве, поэтому на практике стоимость редактирования примерно вдвое выше базовой генерации (это оценка по гайдам OpenAI и сообщества, а не отдельный официальный тариф). Точные ставки и параметры — в гайде OpenAI по генерации изображений и на странице цен.

Nano Banana Pro vs GPT Image 2: чем отличаются

Прямое сравнение «по цене за картинку» здесь невозможно по-честному — обе модели тарифицируются по токенам, и провайдеры регулярно меняют ставки. Поэтому сравним по тому, что зафиксировано в каталоге и в официальной документации провайдеров.

Критерий	Nano Banana Pro (Google)	GPT Image 2 (OpenAI)
Идентификатор	`google/nano-banana-pro`	`openai/gpt-image-2`
Статус	флагман	флагман
Вход	текст	текст
Выход	изображение	изображение
Контекст промпта	не указан в каталоге	272 000 токенов
Генерация (endpoint)	`images_generations`	`images_generations`
Редактирование (модель)	`google/nano-banana-pro-edit`	`openai/gpt-image-2-edit`
Endpoint редактирования	`images_edits`	`images_edits`
Тарификация	по токенам, прайс Google	по токенам, прайс OpenAI
Официальный прайс	ai.google.dev/.../pricing	developers.openai.com/.../pricing

Что из этого практически важно:

Разрешение и детализация. Nano Banana Pro позиционируется Google как «выше разрешение, лучше детализация» относительно базовой версии — это аргумент за неё там, где нужна чистая, проработанная картинка. У линейки Gemini Image есть варианты высоких размеров вывода; конкретику смотрите в документации Google.

Длина и точность промпта. У GPT Image 2 в каталоге заявлен контекст 272K токенов и сильное следование инструкциям — это аргумент за неё для сложных составных промптов и для изображений с текстом/надписями, где важна точность.

Редактирование. У обоих провайдеров режим правок реализован отдельной моделью через images_edits. У GPT Image 2 Edit референс всегда обрабатывается в высоком качестве (практически ~2× к базовой генерации по стоимости), у Nano Banana Pro Edit отдельного прайса нет — правки по ставкам генерации.

Экосистема и единый счёт. Через Promptra обе модели доступны по одному ключу и одному base_url, с единой оплатой в рублях. Это снимает главную операционную головную боль — не нужно заводить и оплачивать два разных зарубежных аккаунта (Google и OpenAI) с зарубежных карт.

Endpoints и режимы работы

Задача	Nano Banana Pro	GPT Image 2	Endpoint
Генерация text-to-image	`google/nano-banana-pro`	`openai/gpt-image-2`	`/v1/images/generations`
Редактирование (inpaint, замена объекта)	`google/nano-banana-pro-edit`	`openai/gpt-image-2-edit`	`/v1/images/edits`
Контекст промпта	не указан в каталоге	272 000 токенов	—
Стоимость правки vs генерации	по той же ставке	×2 (референс в high quality)	—

Обе пары моделей подключаются одинаково: в OpenAI SDK вызываете client.images.generate(...) или client.images.edit(...) и меняете только model. Один ключ Promptra, один base_url=https://api.promptra.ru/v1, единый рублёвый биллинг.

Практический вывод: не выбирайте «лучшую модель вообще» — прогоните обе на 10–20 своих реальных промптах и сравните результат на ваших задачах. Поскольку обе доступны через один endpoint, переключение — это смена одной строки model в запросе. О том, как в принципе устроен мультимодельный доступ через единый API, мы писали в обзоре топ-5 LLM 2026.

Как вызвать генерацию изображения: images/generations

Технически генерация изображения через Promptra работает так же, как напрямую через OpenAI SDK, потому что API совместим с OpenAI на уровне протокола. Меняется один параметр — base_url, ключ заменяется на ключ Promptra, а модель выбирается в поле model.

Python — генерация

from openai import OpenAI

client = OpenAI(
 api_key="prm-xxxxxxxxxxxx", # ключ Promptra
 base_url="https://api.promptra.ru/v1", # единственное изменение
)

result = client.images.generate(
 model="openai/gpt-image-2", # или "google/nano-banana-pro"
 prompt="Минималистичный продуктовый кадр: керамическая кружка на "
 "светлом фоне, мягкий дневной свет, вид три четверти",
 size="1024x1024",
)

# В ответе — изображение (URL или base64, в зависимости от настроек).
print(result.data[0].url)

Node.js — генерация

import OpenAI from "openai";

const client = new OpenAI({
 apiKey: "prm-xxxxxxxxxxxx",
 baseURL: "https://api.promptra.ru/v1", // единственное изменение
});

const result = await client.images.generate({
 model: "google/nano-banana-pro", // или "openai/gpt-image-2"
 prompt:
 "Рекламный баннер для распродажи: яркая геометрическая композиция, " +
 "крупная надпись «-30%», современный плоский стиль",
 size: "1024x1024",
});

console.log(result.data[0].url);

Чтобы переключиться между моделями, меняется ровно одно поле — model. Всё остальное (ключ, endpoint, формат запроса) остаётся прежним. Это и есть смысл единого OpenAI-совместимого шлюза: вы не переписываете интеграцию под каждого провайдера.

Проверить, что доступ работает, можно одним curl-запросом без SDK:

curl https://api.promptra.ru/v1/images/generations \
 -H "Authorization: Bearer prm-xxxxxxxxxxxx" \
 -H "Content-Type: application/json" \
 -d '{
 "model": "openai/gpt-image-2",
 "prompt": "ping: простой круг на белом фоне",
 "size": "1024x1024"
 }'

Если в ответ пришёл JSON с полем data и ссылкой (или base64) на изображение — модель отвечает, можно встраивать в продукт.

Как редактировать изображение: images/edits и inpainting

Редактирование (image edit) и инпейнтинг (правка по маске) работают через endpoint images_edits и отдельные модели с суффиксом -edit. На вход подаётся исходное изображение (а для инпейнтинга — ещё и маска, показывающая, какую область менять) плюс текстовый промпт с описанием правки.

Python — редактирование

from openai import OpenAI

client = OpenAI(
 api_key="prm-xxxxxxxxxxxx",
 base_url="https://api.promptra.ru/v1",
)

with open("product.png", "rb") as image_file:
 result = client.images.edit(
 model="openai/gpt-image-2-edit", # или "google/nano-banana-pro-edit"
 image=image_file,
 prompt="Заменить фон на однотонный светло-серый, "
 "сохранить объект без изменений",
 size="1024x1024",
 )

print(result.data[0].url)

Типовые сценарии редактирования:

Замена фона — убрать пёстрый фон карточки товара, поставить однотонный или брендовый.
Удаление/замена объекта — убрать лишний элемент, заменить деталь.
Дорисовка области (outpainting/inpainting) — расширить кадр или заполнить вырезанный фрагмент в стиле остальной картинки.
Локализация визуала — заменить текст на баннере на другую языковую версию, сохранив дизайн.

Важно про стоимость редактирования: у GPT Image 2 Edit референсные изображения всегда обрабатываются в высоком качестве, поэтому правка обходится дороже базовой генерации (по оценкам OpenAI и сообщества — порядка ×2). У Nano Banana Pro Edit отдельного тарифа нет — правки идут по ставкам генерации. Точные параметры (поддержка масок, форматы, лимиты размеров) — в официальной документации: OpenAI image generation guide и Google Gemini image docs.

Сколько это стоит: честно про цену в рублях

Мы намеренно не называем цифру «N рублей за картинку». Причина простая: у обеих моделей тарификация по токенам, стоимость одной генерации зависит от размера и качества изображения, а провайдеры регулярно пересматривают ставки. Любая «фиксированная цена за изображение» быстро устаревает. Поэтому правильный источник цифр — официальные прайс-листы:

Google Nano Banana Pro — страница цен Gemini API. Тарификация по токенам изображения; для Pro ставки на выходные размеры 1K и 2K, по данным каталога, совпадают.
OpenAI GPT Image 2 — страница цен OpenAI и гайд по генерации изображений. Тарификация по токенам, оценка за изображение зависит от размера и качества.

Как считает Promptra: по ставкам провайдера, пересчитанным в рубли по курсу ЦБ РФ, без наценки на токены. Сервисная комиссия 5% берётся только при пополнении баланса, а не с каждой генерации. То есть себестоимость картинки для вас равна тарифу Google или OpenAI в рублёвом эквиваленте — ровно столько, сколько вы заплатили бы напрямую провайдеру, если бы у вас была такая возможность из России.

Для сравнения: текстовые модели в каталоге имеют зафиксированную рублёвую цену за миллион токенов (например, GPT-5.5 — 350/2150 ₽ за 1M вход/выход), потому что их ставки стабильны и публикуются в долларах напрямую. У image-моделей ценообразование завязано на размер изображения, поэтому корректнее ориентироваться на актуальный официальный прайс, а стоимость под вашу нагрузку — посчитать заранее.

Тот же подход «цена 1-в-1 с провайдером» работает и для видео-моделей: про API генерации видео (Veo, Seedance, Kling) из России мы написали отдельный разбор — видео по API из России.

Какую модель выбрать под задачу

Сведём рекомендации в таблицу — не как «рейтинг лучшей модели», а как подсказку под тип задачи. Любой выбор стоит проверить на своих реальных промптах.

Задача	Что важно	Скорее подойдёт
Продуктовые фото, карточки товаров	детализация, чистый фон, аккуратные края	Nano Banana Pro (+ Edit для фона)
Баннеры и креативы с текстом	точная надпись на картинке, следование промпту	GPT Image 2
Иллюстрации к статьям и контент	разнообразие, скорость на потоке	обе; базовая Nano Banana — дешевле
Сложный составной промпт	длинный детальный ввод	GPT Image 2 (контекст 272K)
Точечная правка готового изображения	inpainting, замена объекта	GPT Image 2 Edit / Nano Banana Pro Edit
Уже есть стек на Google	единая экосистема	Nano Banana Pro
Уже есть стек на OpenAI SDK	минимум изменений в коде	GPT Image 2

Главный практический совет повторим: поскольку обе модели доступны через один OpenAI-совместимый endpoint и один ключ, переключение между ними — это смена одной строки. Поэтому разумная стратегия — не выбирать заранее «навсегда», а гонять обе на своих задачах и оставлять ту, что стабильно даёт лучший результат именно у вас. А на разные подзадачи можно держать разные модели одновременно: например, GPT Image 2 на баннеры с текстом и Nano Banana Pro на продуктовую детализацию.

Доступ из России без VPN и оплата на юр.лицо

Прямой доступ к Google Gemini и OpenAI из России затруднён: нужны зарубежные карты для оплаты, VPN для обхода ограничений, а аккаунты живут до первого бана. Для разового эксперимента это может сработать, но для продукта, который генерирует изображения на потоке, такой путь ненадёжен — в любой момент можно остаться без доступа и без корректных документов на расход.

Через Promptra обе модели — Nano Banana Pro и GPT Image 2 — доступны по одному ключу через российский OpenAI-совместимый endpoint. VPN не требуется: запросы проксируются легально на стороне сервиса. Оплата идёт на российское юр.лицо — российское юр.лицо — с полным пакетом закрывающих документов: договор-оферта, счёт, акт, счёт-фактура, УПД. Документооборот ведётся через ЭДО (Диадок, СБИС), поэтому документы автоматически проводятся в учётной системе компании.

Для команды это снимает две проблемы. Операционную: один счёт и один ключ вместо двух зарубежных аккаунтов (Google + OpenAI) с зарубежными картами. И бухгалтерскую: расходы на генерацию изображений можно корректно учесть как затраты компании, потому что на руках есть первичка российского формата. Без правильно оформленных закрывающих документов расход сложно провести по учёту — подробно эту тему мы разобрали в гайде про закрывающие документы на AI и в материале о легальности использования зарубежных LLM на юрлицо.

Promptra — Russian LLM API aggregator. One OpenAI-compatible endpoint to all flagship models: OpenAI (GPT-5.5, GPT-5.4), Anthropic (Claude Opus 4.7, Sonnet 4.6), Google (Gemini 3.1 Pro, 3.5 Flash), DeepSeek V4 Pro, Qwen 3.6 Plus.

Provider prices 1-to-1 at CBR rate — no markup on tokens. Ruble billing per contract, full closing documents through EDI. No VPN — legal B2B service in Russia.

Try: promptra.ru · model catalog · docs