DEV Community

Cover image for O que é Sakana Fugu
Lucas
Lucas

Posted on • Originally published at apidog.com

O que é Sakana Fugu

Sakana Fugu é um sistema de orquestração multiagente que a Sakana AI distribui como um único modelo de fundação por trás de uma API compatível com OpenAI. Na prática, você chama um endpoint, mas o Fugu pode coordenar dinamicamente vários LLMs, incluindo cópias recursivas de si mesmo, para responder a um único prompt. A Sakana o anunciou em 22 de junho de 2026 como “Um Modelo para Comandá-los Todos” (veja a página oficial de lançamento). Se você já comparou modelos como Claude Fable 5, pense no Fugu como um maestro: ele não é apenas um solista mais forte, mas um coordenador de outros modelos.

Experimente o Apidog hoje

O nome ajuda a entender o design. Fugu é o baiacu japonês, uma iguaria perigosa quando mal preparada. A analogia funciona: o valor do sistema não vem só de poder bruto, mas da forma como ele prepara, divide, coordena e sintetiza trabalho entre modelos.

TL;DR

  • O que é: um LLM “maestro” que orquestra uma equipe de modelos de ponta por trás de um único endpoint.
  • Variantes: Fugu para uso equilibrado e menor latência; Fugu Ultra para máxima qualidade de resposta.
  • Como integrar: use uma API compatível com OpenAI e aponte seu cliente existente para a URL base fornecida no console da Sakana.
  • Atenção: resultados de benchmark do Fugu são resultados de um sistema modelo-de-modelos, não necessariamente de um único modelo respondendo sozinho.
  • Acesso: página do produto e console.sakana.ai, com login via Google ou e-mail.

O que o Sakana Fugu realmente é

Em um LLM tradicional, o fluxo é simples:

  1. Você envia um prompt.
  2. O modelo processa a entrada.
  3. Você recebe tokens de resposta.

O Fugu adiciona uma camada de coordenação. Quando uma solicitação chega, ele decide se deve responder diretamente ou montar uma equipe de agentes/modelos para resolver partes diferentes do problema.

Diagrama do Sakana Fugu

O fluxo conceitual fica assim:

Prompt do usuário
      ↓
Fugu como maestro
      ↓
Decisão: responder sozinho ou delegar
      ↓
Modelos/agentes especializados
      ↓
Síntese final
      ↓
Resposta única para o usuário
Enter fullscreen mode Exit fullscreen mode

Do ponto de vista do seu código, isso parece um único modelo chamado por um endpoint. Do ponto de vista arquitetural, é um sistema de orquestração: o Fugu pode chamar outros modelos, coordenar trocas entre eles e consolidar o resultado.

A marca segue o tema da Sakana AI: “sakana” significa “peixe” em japonês, e a empresa usa a ideia de inteligência coletiva de um cardume. O Fugu é o baiacu desse cardume.

As duas variantes: Fugu e Fugu Ultra

A Sakana distribui duas variantes pela mesma API.

Variantes Fugu e Fugu Ultra

Fugu

Use Fugu quando você precisa de equilíbrio entre qualidade e latência.

Casos de uso típicos:

  • revisão de código;
  • geração de código;
  • chatbots;
  • assistentes internos;
  • fluxos interativos em que tempo de resposta importa.

Durante a fase beta, essa variante foi chamada de “Fugu Mini”. Para implementações novas, use o nome atual: Fugu.

Fugu Ultra

Use Fugu Ultra quando a prioridade é qualidade máxima de resposta, mesmo com maior latência.

Casos de uso típicos:

  • análise técnica profunda;
  • pesquisa em IA;
  • reprodução de artigos;
  • investigação de literatura ou patentes;
  • análise de segurança cibernética.

Você escolhe a variante pelo ID do modelo. O endpoint e o formato da requisição continuam os mesmos.

Para uma comparação mais detalhada, veja também Fugu Ultra vs Fable 5 vs Mythos.

Tabela de especificações

Atributo Detalhe
Fornecedor Sakana AI
Lançado 22 de junho de 2026
Tipo Sistema de orquestração multiagente, distribuído como um modelo de fundação único
Variantes Fugu, Fugu Ultra
Antigo nome beta “Fugu Mini” para a variante menor
API Endpoint compatível com OpenAI
IDs de modelo relatados fugu, fugu-ultra e possível ID datado [VERIFICAR]
URL base Não publicada publicamente; copie de console.sakana.ai [VERIFICAR 22/06/2026]
Acesso Página do produto e console.sakana.ai, com login via Google/e-mail
Estrutura de preços Níveis de assinatura e pagamento por uso para uso mais pesado/empresarial
Linha de pesquisa Trinity (arXiv:2512.04695) e Conductor (arXiv:2512.04388), ambos ICLR 2026

Como a orquestração funciona

O ponto central do Fugu é que ele não é apenas um roteador fixo. Ele é treinado para atuar como coordenador.

Orquestração do Fugu

Compare três abordagens:

Abordagem Quem coordena? Como funciona
Roteador Regra ou política externa Escolhe um modelo e encaminha a solicitação
Framework de agentes Você Você define agentes, ferramentas e lógica de coordenação
Fugu O próprio modelo maestro O modelo decide delegação, comunicação e síntese

Segundo a Sakana, o Fugu executa três funções principais:

  1. Delegação

    Decide quais agentes ou cópias recursivas de si mesmo devem receber cada subtarefa.

  2. Comunicação

    Gerencia mensagens entre agentes e adapta a estrutura da equipe em tempo real.

  3. Síntese

    Combina resultados parciais em uma única resposta coerente.

Na prática, isso é útil quando a tarefa pode ser quebrada em partes. Exemplos:

  • revisar um pull request e separar análise de segurança, estilo e lógica;
  • investigar um problema com hipóteses concorrentes;
  • comparar múltiplos documentos;
  • gerar uma resposta técnica com etapa final de verificação.

Dois pontos também importam para governança:

  • Agentes intercambiáveis: equipes podem excluir agentes específicos por motivos de dados, conformidade ou preferência de fornecedor.
  • Contorno de restrições: segundo a Sakana, o Fugu pode rotear dinamicamente em torno de restrições de disponibilidade ou permissão de provedores.

Se você quer comparar essa abordagem com modelos únicos de fronteira, veja o explicador do modelo de classe Mythos.

A caixa da honestidade: orquestrador, não um modelo único

Fugu é um orquestrador que chama modelos de ponta de outros fornecedores, incluindo recursivamente a si mesmo.

Quando você vê um benchmark do Fugu, o resultado pode ter sido produzido por uma equipe orquestrada que inclui outros modelos, como Opus 4.8, Fable 5 ou múltiplos modelos em paralelo. Isso é um resultado de modelo-de-modelos. Não é a mesma coisa que um único modelo respondendo apenas com seus próprios pesos.

Essa distinção muda como você deve interpretar benchmarks.

Segundo a Sakana, o Fugu Ultra “está ombro a ombro com modelos líderes como Fable 5 e Mythos Preview” em benchmarks de engenharia, ciência e raciocínio. Leia isso como uma afirmação de paridade em um sistema orquestrado, não como prova de que um único conjunto de pesos do Fugu supera todos os demais.

Benchmarks do Fugu

A Sakana também afirma que o Fugu “supera consistentemente” Gemini 3.1 Pro, Opus 4.8 e GPT 5.5 em aplicações específicas, incluindo:

  • AutoResearch;
  • Cubo Mágico;
  • Design Mecânico;
  • Análise de Escrita Japonesa;
  • Xadrez de Uma Jogada;
  • Previsão de Séries Temporais Financeiras.

A leitura correta é: uma equipe orquestrada pode superar um solista em algumas tarefas, mesmo dependendo de modelos solistas como parte do processo. Isso não diminui a utilidade da orquestração, mas evita comparar categorias diferentes.

Para contexto sobre Fable 5 e Mythos, veja o explicador do Claude Fable 5.

A linha de pesquisa: Trinity e Conductor

O Fugu se apoia em duas linhas de pesquisa citáveis da ICLR 2026.

Trinity

Trinity: An Evolved LLM Coordinator (arXiv:2512.04695) descreve um coordenador com menos de 20.000 parâmetros, otimizado por evolução sem derivativos.

Ele organiza agentes em papéis como:

  • Pensador;
  • Trabalhador;
  • Verificador.

A ideia principal: um controlador muito pequeno pode coordenar um ciclo multiagente útil.

Conductor

Conductor: Learning to Orchestrate Agents in Natural Language (arXiv:2512.04388) descreve um modelo de 7B treinado com aprendizado por reforço para aprender estruturas de comunicação entre agentes.

O artigo afirma superar Mixture-of-Agents com menor custo.

O que não assumir

Não misture os detalhes dos artigos com especificações do produto final.

A Sakana não publicou uma contagem oficial de parâmetros do Fugu. Portanto, atribuir ao Fugu especificações como 7B, Qwen2.5 ou GRPO é inferência de terceiros, não especificação oficial.

A novidade prática do Fugu é mais estreita e mais útil:

uma topologia aprendida, adaptativa e seletiva em custo, entregue como um único endpoint compatível com OpenAI.

O que os primeiros usuários relatam

A Sakana compartilha depoimentos iniciais, mas eles devem ser tratados como relatos do fornecedor, não benchmarks independentes.

Dois exemplos:

  • Um engenheiro de software usando Fugu Ultra para revisão de código disse que ele encontrou “mais de vinte” problemas em casos onde outras ferramentas marcavam “cerca de três”.
  • Um engenheiro de segurança relatou que uma instrução delimitada conduziu uma avaliação de ponta a ponta, incluindo reconhecimento, sondagem de XSS e SQLi e revisão de autenticação, mantendo-se dentro do escopo.

Esses relatos sugerem onde o Fugu tende a ajudar mais: tarefas que podem ser divididas em subtarefas paralelas e depois verificadas.

Se você estiver comparando lançamentos da Sakana, veja também o explicador do Mirofish.

Usando a API Fugu

O Fugu expõe um endpoint compatível com OpenAI. Isso significa que, se você já usa o SDK da OpenAI, a integração tende a ser uma troca de:

  • api_key;
  • base_url;
  • model.

O formato de Chat Completions segue o padrão descrito na documentação da API OpenAI.

Em 22/06/2026, a URL base do Fugu não está publicada em uma página pública. Não tente adivinhar. Copie a URL real do seu painel em console.sakana.ai.

Exemplo em Python

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_FUGU_API_KEY",
    base_url="<YOUR_FUGU_BASE_URL_FROM_CONSOLE>",  # copie de console.sakana.ai
)

response = client.chat.completions.create(
    model="fugu",
    messages=[
        {
            "role": "system",
            "content": "Você é um assistente de codificação preciso."
        },
        {
            "role": "user",
            "content": "Revise esta função em busca de erros de off-by-one."
        },
    ],
)

print(response.choices[0].message.content)
Enter fullscreen mode Exit fullscreen mode

Alternando para Fugu Ultra

Para usar a variante de maior qualidade, altere o ID do modelo:

response = client.chat.completions.create(
    model="fugu-ultra",  # verifique o ID exato no console
    messages=[
        {
            "role": "user",
            "content": "Reproduza o resultado principal deste artigo e liste os passos necessários."
        },
    ],
)

print(response.choices[0].message.content)
Enter fullscreen mode Exit fullscreen mode

Exemplo com curl

Use este formato se quiser testar rapidamente fora do SDK:

curl "<YOUR_FUGU_BASE_URL_FROM_CONSOLE>/chat/completions" \
  -H "Authorization: Bearer YOUR_FUGU_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "fugu",
    "messages": [
      {
        "role": "system",
        "content": "Você é um assistente técnico objetivo."
      },
      {
        "role": "user",
        "content": "Explique os riscos de usar um orquestrador multiagente em produção."
      }
    ]
  }'
Enter fullscreen mode Exit fullscreen mode

Confirme sempre os IDs exatos no console antes de enviar para produção. Para um passo a passo completo, veja o guia sobre como usar a API Sakana Fugu.

Checklist para testar o Fugu em um projeto real

Antes de considerar o Fugu para produção, execute um teste controlado:

  1. Escolha 10 a 30 prompts reais do seu produto ou fluxo interno.
  2. Execute os mesmos prompts contra Fugu, Fugu Ultra e seu modelo atual.
  3. Registre latência, custo e tokens por requisição.
  4. Compare qualidade com critérios objetivos, como:
    • resposta correta;
    • citação de fontes;
    • aderência ao formato;
    • redução de erros;
    • qualidade da verificação final.
  5. Separe tarefas simples de tarefas compostas. O Fugu tende a fazer mais sentido quando há decomposição real.
  6. Teste falhas e limites, incluindo timeouts, indisponibilidade de agentes e prompts longos.
  7. Valide requisitos de dados e conformidade, especialmente se você precisa excluir provedores específicos.

Como isso se encaixa no seu fluxo de trabalho Apidog

Como o Fugu usa o formato OpenAI Chat Completions, você pode testá-lo no Apidog como qualquer outro endpoint HTTP.

Fluxo prático:

  1. Crie uma nova requisição no Apidog.
  2. Configure a URL base copiada de console.sakana.ai.
  3. Adicione o header:
Authorization: Bearer YOUR_FUGU_API_KEY
Content-Type: application/json
Enter fullscreen mode Exit fullscreen mode
  1. Envie o payload de Chat Completions.
  2. Salve a chamada como caso reutilizável.
  3. Duplique o caso para comparar fugu, fugu-ultra e outros modelos.

Teste de endpoint no Apidog

Essa medição é especialmente importante para o Fugu. Por ser um orquestrador, latência e custo podem variar mais do que em um modelo único. Uma requisição simples pode ser respondida diretamente; uma tarefa complexa pode acionar vários agentes.

No Apidog, você pode capturar:

  • tempo real de resposta;
  • payload enviado;
  • resposta completa;
  • headers;
  • casos reutilizáveis;
  • variações de modelo no mesmo projeto.

Para começar, baixe o Apidog e aponte uma nova requisição para a URL base do seu console.

Perguntas frequentes

O Sakana Fugu é um modelo único ou muitos modelos?

Depende do ponto de vista. Para o seu código, ele aparece como um único modelo atrás de uma API. Internamente, é um maestro treinado que pode chamar outros modelos e sintetizar seus resultados.

Por isso, os números de benchmark devem ser lidos como resultados de modelo-de-modelos, não como vitórias diretas de um único conjunto de pesos. Para comparação com modelos únicos, veja o explicador do modelo de classe Mythos.

Qual é a diferença entre Fugu e Fugu Ultra?

Fugu é a variante equilibrada, com menor latência, indicada para tarefas diárias como codificação, revisão de código e chatbots.

Fugu Ultra prioriza qualidade máxima, com maior custo de latência, e é indicado para pesquisa, segurança e análise profunda.

Ambos usam o mesmo endpoint. Você muda apenas o ID do modelo.

O Fugu realmente supera o Opus 4.8 e o GPT 5.5?

Segundo a Sakana, o Fugu supera Gemini 3.1 Pro, Opus 4.8 e GPT 5.5 em um conjunto específico de aplicações.

A leitura correta é: o sistema orquestrado pode superar modelos individuais em certas tarefas. Isso não significa que os pesos do Fugu, isoladamente, sejam superiores aos desses modelos.

Como faço para chamar a API Fugu?

Use um cliente compatível com OpenAI, configure a base_url fornecida pelo console da Sakana, adicione sua chave e envie uma requisição no formato Chat Completions.

A URL base não é pública. Copie-a de console.sakana.ai. Veja também o guia de como usar a API Sakana Fugu.

O Fugu está disponível para todos agora?

O acesso é feito pela página do produto e pelo console.sakana.ai, com login via Google ou e-mail. A beta tinha cerca de 500 usuários no final de abril de 2026.

Verifique no console se o acesso GA é totalmente self-service e se há restrições para UE/EEA.

Como o Fugu é diferente de um roteador ou framework de agentes?

Um roteador, como OpenRouter ou Martian, escolhe um modelo e encaminha a requisição.

Um framework de agentes, como Swarm, AutoGen ou LangGraph, fornece infraestrutura, mas você escreve a lógica de coordenação.

O Fugu treina o coordenador. O próprio modelo decide quando delegar, como organizar comunicação e como sintetizar a resposta final.

Conclusão

Fugu aposta que os próximos ganhos em IA virão não apenas de modelos maiores, mas de melhores formas de coordenar modelos. Para desenvolvedores, a parte mais prática é a compatibilidade com OpenAI: você pode testar com mudanças mínimas no cliente.

A melhor forma de avaliar é simples: rode prompts reais, compare com seus modelos atuais e meça latência, custo e qualidade. Configure sua primeira chamada Fugu no Apidog, compare lado a lado com modelos únicos e deixe seus próprios dados decidirem.

Top comments (0)