Lucas

Posted on Jun 22 • Originally published at apidog.com

Precificação Sakana Fugu: Planos de Assinatura, Pague Conforme o Uso e o Modelo de Custo Repassado

Os preços do Sakana Fugu devem ser avaliados como um sistema de orquestração, não como um modelo de chat tradicional. A estrutura confirmada combina assinaturas para uso diário e pagamento por uso para cargas maiores. O ponto diferente é o faturamento de repasse (passthrough billing): vários agentes podem ser acionados por uma única requisição sem uma taxa separada por agente. Os valores em dólar abaixo vêm de fontes secundárias, porque a própria página de lançamento da Sakana descreve a estrutura, mas não publica os números diretamente. Para contexto, o Fugu é apresentado como um sistema de orquestração, o que torna esse modelo de cobrança possível.

Experimente o Apidog hoje

Como os preços do Fugu são estruturados

O Fugu funciona como um condutor: ele decide se responde diretamente ou se delega partes do trabalho para modelos trabalhadores, incluindo possíveis chamadas recursivas a si mesmo. Isso muda a forma correta de estimar custo.

A Sakana confirma dois caminhos de compra:

Assinatura: indicada para uso diário previsível, como codificação, revisão de código, chatbots e serviços interativos.
Pagamento por uso (PAYG): indicado para cargas mais pesadas, workloads em lote, pesquisa e tráfego com picos.

As variantes reportadas são:

fugu: variante balanceada.
fugu-ultra: variante de maior qualidade.

Ambas ficam atrás de um endpoint compatível com OpenAI. Na prática, você troca apenas a base_url, a chave de API e o model.

Não há um nível gratuito autônomo reportado. A alternativa mais próxima é uma promoção de lançamento, descrita mais abaixo.

Para testar antes de assumir um compromisso mensal, execute algumas chamadas reais e registre o uso de tokens por requisição. Com um orquestrador, isso é mais importante do que em uma API de modelo único, porque uma chamada pode acionar várias chamadas internas. O Apidog pode ajudar a observar requisição por requisição durante os testes.

Preços reportados: confirme no console antes de orçar

Assinaturas reportadas

Plano	Preço mensal reportado	Indicado para
Básico	reportado $20 / mês	Desenvolvedores individuais e uso diário leve
Intermediário	reportado $100 / mês	Equipes, codificação e revisão constantes
Avançado	reportado $200 / mês	Usuários avançados e serviços interativos de alto volume

A mesma estrutura de níveis é reportada tanto para o Fugu quanto para o Fugu Ultra.

Também há relatos de uma promoção de lançamento com um segundo mês gratuito para assinaturas feitas antes do final de julho de 2026. Como essa oferta não está confirmada na página de lançamento, trate-a como não garantida até verificá-la no console da Sakana.

Taxas PAYG reportadas

Tipo de token	Taxa reportada por 1M de tokens	Sobretaxa reportada acima de 272K de contexto
Entrada	reportado $5	reportado $10
Saída	reportado $30	reportado $45
Entrada em cache	reportado $0.50	reportado $1.00

O ponto crítico é a coluna de contexto longo. Requisições acima de aproximadamente 272K tokens supostamente custam mais por milhão de tokens.

Em workloads de orquestração, prompts e contexto podem crescer rápido porque o condutor repassa informações entre agentes trabalhadores. Portanto, uma execução do Fugu Ultra para tarefas de pesquisa pode entrar nessa faixa antes do esperado.

Se você já comparou preços de modelos de fronteira, o formato é semelhante ao usado em análises como a de preços do Claude Fable 5.

Como estimar custo de forma prática

Antes de escolher um plano, execute um pequeno benchmark com tráfego parecido com o seu.

Use esta sequência:

Separe 20 a 50 prompts reais.
Classifique-os por tipo: simples, médio, difícil, contexto longo.
Execute os mesmos prompts com fugu e, se necessário, com fugu-ultra.
Registre prompt_tokens, completion_tokens e total_tokens.
Compare o custo médio por classe de tarefa.
Verifique se o custo por requisição é previsível ou se há picos.

Exemplo de estrutura para log:

timestamp,model,task_type,prompt_tokens,completion_tokens,total_tokens
2026-06-09T10:00:00Z,fugu,code_review,1200,800,2000
2026-06-09T10:01:00Z,fugu-ultra,research,18000,6000,24000

Com esse log, você consegue responder à pergunta mais importante: seu tráfego é majoritariamente simples com alguns casos difíceis, ou quase tudo exige nível de fronteira?

Você ainda paga uma margem Sakana sobre modelos trabalhadores

A leitura correta do repasse é esta: a variante base do Fugu segue a taxa do modelo subjacente chamado, mas Fugu Ultra e PAYG podem ser mais caros porque incluem a operação do condutor.

Você paga pela camada de orquestração, que inclui:

decisão de roteamento;
comunicação entre agentes;
coordenação de chamadas internas;
síntese da resposta final.

A base técnica citada pela Sakana aponta nessa direção:

O artigo Trinity descreve um coordenador com menos de 20.000 parâmetros otimizado por evolução.
O artigo Conductor descreve um modelo de 7B treinado com aprendizado por reforço que afirma superar Mixture-of-Agents com menor custo.

O orquestrador em si pode ser barato. O que encarece são os modelos que ele decide chamar.

Em termos práticos:

Se muitos prompts forem simples, o Fugu pode evitar chamadas caras.
Se quase todos os prompts exigirem modelos de fronteira, o custo efetivo pode se aproximar ou superar uma chamada direta a um modelo de fronteira.

Comparando com preços reais de modelos de fronteira

Os números do Fugu não devem ser avaliados isoladamente. Compare com modelos que têm preço publicado. Estes valores vêm dos preços da Anthropic de 09/06/2026:

Modelo	Entrada por 1M	Saída por 1M	Descrição
Fable 5	$10	$50	Modelo mais poderoso da Anthropic disponível publicamente, um nível acima do Opus 4.8
Mythos 5	$10	$50	Mesma faixa de preço do Fable 5
Mythos Preview	$25	$125	Modelo de fronteira de abril de 2026 retido como "muito perigoso para ser lançado"

Comparado ao PAYG reportado do Fugu, cerca de $5 por 1M de tokens de entrada e $30 por 1M de tokens de saída, o Fugu parece mais barato no papel.

Mas essa comparação é incompleta.

A Sakana afirma que o Fugu Ultra "se equipara a modelos líderes como Fable 5 e Mythos Preview" em benchmarks de engenharia, ciência e raciocínio. Essa é uma afirmação de paridade, não de superioridade.

Além disso, o Fugu é um orquestrador. Quando entrega uma resposta de nível de fronteira, pode ter chamado um modelo de fronteira e sintetizado o resultado. O custo efetivo depende das decisões internas do condutor.

Se você ainda está configurando o acesso, veja o guia sobre como acessar o Sakana Fugu. A diferença central é esta: Fable 5 e Mythos são modelos únicos com preço publicado; Fugu é um sistema cujo custo depende dos modelos que ele ativa.

Chamando o Fugu com um cliente compatível com OpenAI

Como o Fugu expõe um endpoint compatível com OpenAI, você pode reutilizar um cliente existente.

A URL base não é publicada em página pública. Copie a URL real do console da Sakana e evite codificar um host presumido.

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_SAKANA_API_KEY",
    base_url="<YOUR_FUGU_BASE_URL_FROM_CONSOLE>",
)

response = client.chat.completions.create(
    model="fugu",
    messages=[
        {
            "role": "user",
            "content": "Review this function for security issues."
        },
    ],
)

print(response.choices[0].message.content)
print(response.usage)

Para testar a variante de maior qualidade, troque apenas o modelo:

response = client.chat.completions.create(
    model="fugu-ultra",
    messages=[
        {
            "role": "user",
            "content": "Analyze this architecture and identify scaling risks."
        },
    ],
)

print(response.usage)

As strings fugu e fugu-ultra, possivelmente com sufixos de data, são reportadas. Confirme os IDs reais no console antes de colocar em produção.

O contrato de request e response segue o padrão de chat completions da OpenAI. Para um passo a passo completo de configuração, veja o guia sobre como usar a API Sakana Fugu.

Registrando uso por requisição

Em produção, registre response.usage em todas as chamadas. Esse campo é o principal indicador de custo.

Exemplo simples:

import csv
from datetime import datetime, timezone
from openai import OpenAI

client = OpenAI(
    api_key="YOUR_SAKANA_API_KEY",
    base_url="<YOUR_FUGU_BASE_URL_FROM_CONSOLE>",
)

def run_fugu(prompt: str, model: str = "fugu", task_type: str = "general"):
    response = client.chat.completions.create(
        model=model,
        messages=[{"role": "user", "content": prompt}],
    )

    usage = response.usage

    with open("fugu_usage.csv", "a", newline="") as file:
        writer = csv.writer(file)
        writer.writerow([
            datetime.now(timezone.utc).isoformat(),
            model,
            task_type,
            usage.prompt_tokens,
            usage.completion_tokens,
            usage.total_tokens,
        ])

    return response.choices[0].message.content

Esse log ajuda a identificar:

prompts que explodem em tokens;
tarefas que exigem fugu-ultra;
casos em que o custo PAYG supera a assinatura;
impacto de contexto longo;
diferença entre tarefas simples e tarefas de fronteira.

Checklist antes de escolher um plano

Use este checklist antes de contratar:

[ ] Confirme os preços no console da Sakana.
[ ] Confirme se a promoção de lançamento ainda existe.
[ ] Confirme os IDs de modelo disponíveis.
[ ] Teste fugu antes de fugu-ultra.
[ ] Rode prompts reais, não apenas exemplos sintéticos.
[ ] Registre response.usage em todas as chamadas.
[ ] Separe métricas por tipo de tarefa.
[ ] Verifique se há workloads acima de 272K tokens.
[ ] Compare o custo efetivo com chamadas diretas a modelos de fronteira.
[ ] Escolha assinatura apenas se o uso mensal for previsível.

Perguntas frequentes

O Fugu tem um nível gratuito?

Nenhum nível gratuito autônomo foi reportado.

A oferta mais próxima é uma promoção de lançamento que supostamente oferece um segundo mês gratuito para assinaturas feitas antes do final de julho de 2026. Essa promoção não está confirmada na página de lançamento, então verifique no console em console.sakana.ai antes de contar com ela.

Por que o Fugu parece mais barato por token, mas pode custar mais?

Porque a taxa reportada por token não conta toda a história operacional.

O Fugu é um orquestrador. Ele pode delegar problemas difíceis a modelos de fronteira de outros fornecedores, e essas chamadas impactam o custo efetivo. Um modelo único de fronteira tem uma taxa publicada mais direta. Por isso, uma comparação com a análise de preços do Claude Fable 5 pode ser mais clara para estabelecer uma linha de base.

O que é faturamento de repasse no Fugu?

É o modelo em que a variante base do Fugu é supostamente faturada pela taxa padrão do modelo subjacente chamado, sem adicionar uma taxa separada de orquestração por agente.

Ainda assim, a variante premium e o plano por token podem incluir margem da Sakana pela camada de orquestração.

Devo escolher assinatura ou pagamento por uso?

Escolha assinatura se você tem uso diário estável, como:

codificação;
revisão de código;
chatbots;
serviços interativos previsíveis.

Escolha PAYG se você tem:

tráfego com picos;
workloads em lote;
tarefas de pesquisa;
uso imprevisível;
testes iniciais antes de estimar volume mensal.

Se você usa contexto longo acima de aproximadamente 272K tokens, inclua a sobretaxa reportada no orçamento.

Como rastrear o custo de uma requisição Fugu?

Registre o campo usage em cada resposta. Ele é o melhor indicador disponível para entender o custo por chamada.

Também vale rotear chamadas por uma ferramenta que registre uso por requisição. Se você está comparando o Fugu com agregadores de roteamento, veja o guia sobre melhores alternativas ao OpenRouter, que discute como medir custo de roteamento versus orquestração.

Conclusão

O preço do Fugu favorece workloads em que a maioria das requisições é simples e apenas uma parte pequena exige raciocínio de fronteira. Ele tende a ser menos vantajoso quando quase todo o tráfego exige modelos caros.

Antes de escolher um plano, teste com prompts reais, registre tokens por chamada e confirme todos os valores reportados no console da Sakana. Para observar o consumo de tokens requisição por requisição durante os testes, baixe o Apidog e roteie suas chamadas compatíveis com OpenAI por ele.

DEV Community