Sakana Fugu é um sistema de orquestração multiagente que a Sakana AI distribui como um único modelo de fundação por trás de uma API compatível com OpenAI. Na prática, você chama um endpoint, mas o Fugu pode coordenar dinamicamente vários LLMs, incluindo cópias recursivas de si mesmo, para responder a um único prompt. A Sakana o anunciou em 22 de junho de 2026 como “Um Modelo para Comandá-los Todos” (veja a página oficial de lançamento). Se você já comparou modelos como Claude Fable 5, pense no Fugu como um maestro: ele não é apenas um solista mais forte, mas um coordenador de outros modelos.
O nome ajuda a entender o design. Fugu é o baiacu japonês, uma iguaria perigosa quando mal preparada. A analogia funciona: o valor do sistema não vem só de poder bruto, mas da forma como ele prepara, divide, coordena e sintetiza trabalho entre modelos.
TL;DR
- O que é: um LLM “maestro” que orquestra uma equipe de modelos de ponta por trás de um único endpoint.
-
Variantes:
Fugupara uso equilibrado e menor latência;Fugu Ultrapara máxima qualidade de resposta. - Como integrar: use uma API compatível com OpenAI e aponte seu cliente existente para a URL base fornecida no console da Sakana.
- Atenção: resultados de benchmark do Fugu são resultados de um sistema modelo-de-modelos, não necessariamente de um único modelo respondendo sozinho.
- Acesso: página do produto e console.sakana.ai, com login via Google ou e-mail.
O que o Sakana Fugu realmente é
Em um LLM tradicional, o fluxo é simples:
- Você envia um prompt.
- O modelo processa a entrada.
- Você recebe tokens de resposta.
O Fugu adiciona uma camada de coordenação. Quando uma solicitação chega, ele decide se deve responder diretamente ou montar uma equipe de agentes/modelos para resolver partes diferentes do problema.
O fluxo conceitual fica assim:
Prompt do usuário
↓
Fugu como maestro
↓
Decisão: responder sozinho ou delegar
↓
Modelos/agentes especializados
↓
Síntese final
↓
Resposta única para o usuário
Do ponto de vista do seu código, isso parece um único modelo chamado por um endpoint. Do ponto de vista arquitetural, é um sistema de orquestração: o Fugu pode chamar outros modelos, coordenar trocas entre eles e consolidar o resultado.
A marca segue o tema da Sakana AI: “sakana” significa “peixe” em japonês, e a empresa usa a ideia de inteligência coletiva de um cardume. O Fugu é o baiacu desse cardume.
As duas variantes: Fugu e Fugu Ultra
A Sakana distribui duas variantes pela mesma API.
Fugu
Use Fugu quando você precisa de equilíbrio entre qualidade e latência.
Casos de uso típicos:
- revisão de código;
- geração de código;
- chatbots;
- assistentes internos;
- fluxos interativos em que tempo de resposta importa.
Durante a fase beta, essa variante foi chamada de “Fugu Mini”. Para implementações novas, use o nome atual: Fugu.
Fugu Ultra
Use Fugu Ultra quando a prioridade é qualidade máxima de resposta, mesmo com maior latência.
Casos de uso típicos:
- análise técnica profunda;
- pesquisa em IA;
- reprodução de artigos;
- investigação de literatura ou patentes;
- análise de segurança cibernética.
Você escolhe a variante pelo ID do modelo. O endpoint e o formato da requisição continuam os mesmos.
Para uma comparação mais detalhada, veja também Fugu Ultra vs Fable 5 vs Mythos.
Tabela de especificações
| Atributo | Detalhe |
|---|---|
| Fornecedor | Sakana AI |
| Lançado | 22 de junho de 2026 |
| Tipo | Sistema de orquestração multiagente, distribuído como um modelo de fundação único |
| Variantes | Fugu, Fugu Ultra |
| Antigo nome beta | “Fugu Mini” para a variante menor |
| API | Endpoint compatível com OpenAI |
| IDs de modelo relatados |
fugu, fugu-ultra e possível ID datado [VERIFICAR] |
| URL base | Não publicada publicamente; copie de console.sakana.ai [VERIFICAR 22/06/2026] |
| Acesso | Página do produto e console.sakana.ai, com login via Google/e-mail |
| Estrutura de preços | Níveis de assinatura e pagamento por uso para uso mais pesado/empresarial |
| Linha de pesquisa | Trinity (arXiv:2512.04695) e Conductor (arXiv:2512.04388), ambos ICLR 2026 |
Como a orquestração funciona
O ponto central do Fugu é que ele não é apenas um roteador fixo. Ele é treinado para atuar como coordenador.
Compare três abordagens:
| Abordagem | Quem coordena? | Como funciona |
|---|---|---|
| Roteador | Regra ou política externa | Escolhe um modelo e encaminha a solicitação |
| Framework de agentes | Você | Você define agentes, ferramentas e lógica de coordenação |
| Fugu | O próprio modelo maestro | O modelo decide delegação, comunicação e síntese |
Segundo a Sakana, o Fugu executa três funções principais:
Delegação
Decide quais agentes ou cópias recursivas de si mesmo devem receber cada subtarefa.Comunicação
Gerencia mensagens entre agentes e adapta a estrutura da equipe em tempo real.Síntese
Combina resultados parciais em uma única resposta coerente.
Na prática, isso é útil quando a tarefa pode ser quebrada em partes. Exemplos:
- revisar um pull request e separar análise de segurança, estilo e lógica;
- investigar um problema com hipóteses concorrentes;
- comparar múltiplos documentos;
- gerar uma resposta técnica com etapa final de verificação.
Dois pontos também importam para governança:
- Agentes intercambiáveis: equipes podem excluir agentes específicos por motivos de dados, conformidade ou preferência de fornecedor.
- Contorno de restrições: segundo a Sakana, o Fugu pode rotear dinamicamente em torno de restrições de disponibilidade ou permissão de provedores.
Se você quer comparar essa abordagem com modelos únicos de fronteira, veja o explicador do modelo de classe Mythos.
A caixa da honestidade: orquestrador, não um modelo único
Fugu é um orquestrador que chama modelos de ponta de outros fornecedores, incluindo recursivamente a si mesmo.
Quando você vê um benchmark do Fugu, o resultado pode ter sido produzido por uma equipe orquestrada que inclui outros modelos, como Opus 4.8, Fable 5 ou múltiplos modelos em paralelo. Isso é um resultado de modelo-de-modelos. Não é a mesma coisa que um único modelo respondendo apenas com seus próprios pesos.
Essa distinção muda como você deve interpretar benchmarks.
Segundo a Sakana, o Fugu Ultra “está ombro a ombro com modelos líderes como Fable 5 e Mythos Preview” em benchmarks de engenharia, ciência e raciocínio. Leia isso como uma afirmação de paridade em um sistema orquestrado, não como prova de que um único conjunto de pesos do Fugu supera todos os demais.
A Sakana também afirma que o Fugu “supera consistentemente” Gemini 3.1 Pro, Opus 4.8 e GPT 5.5 em aplicações específicas, incluindo:
- AutoResearch;
- Cubo Mágico;
- Design Mecânico;
- Análise de Escrita Japonesa;
- Xadrez de Uma Jogada;
- Previsão de Séries Temporais Financeiras.
A leitura correta é: uma equipe orquestrada pode superar um solista em algumas tarefas, mesmo dependendo de modelos solistas como parte do processo. Isso não diminui a utilidade da orquestração, mas evita comparar categorias diferentes.
Para contexto sobre Fable 5 e Mythos, veja o explicador do Claude Fable 5.
A linha de pesquisa: Trinity e Conductor
O Fugu se apoia em duas linhas de pesquisa citáveis da ICLR 2026.
Trinity
Trinity: An Evolved LLM Coordinator (arXiv:2512.04695) descreve um coordenador com menos de 20.000 parâmetros, otimizado por evolução sem derivativos.
Ele organiza agentes em papéis como:
- Pensador;
- Trabalhador;
- Verificador.
A ideia principal: um controlador muito pequeno pode coordenar um ciclo multiagente útil.
Conductor
Conductor: Learning to Orchestrate Agents in Natural Language (arXiv:2512.04388) descreve um modelo de 7B treinado com aprendizado por reforço para aprender estruturas de comunicação entre agentes.
O artigo afirma superar Mixture-of-Agents com menor custo.
O que não assumir
Não misture os detalhes dos artigos com especificações do produto final.
A Sakana não publicou uma contagem oficial de parâmetros do Fugu. Portanto, atribuir ao Fugu especificações como 7B, Qwen2.5 ou GRPO é inferência de terceiros, não especificação oficial.
A novidade prática do Fugu é mais estreita e mais útil:
uma topologia aprendida, adaptativa e seletiva em custo, entregue como um único endpoint compatível com OpenAI.
O que os primeiros usuários relatam
A Sakana compartilha depoimentos iniciais, mas eles devem ser tratados como relatos do fornecedor, não benchmarks independentes.
Dois exemplos:
- Um engenheiro de software usando Fugu Ultra para revisão de código disse que ele encontrou “mais de vinte” problemas em casos onde outras ferramentas marcavam “cerca de três”.
- Um engenheiro de segurança relatou que uma instrução delimitada conduziu uma avaliação de ponta a ponta, incluindo reconhecimento, sondagem de XSS e SQLi e revisão de autenticação, mantendo-se dentro do escopo.
Esses relatos sugerem onde o Fugu tende a ajudar mais: tarefas que podem ser divididas em subtarefas paralelas e depois verificadas.
Se você estiver comparando lançamentos da Sakana, veja também o explicador do Mirofish.
Usando a API Fugu
O Fugu expõe um endpoint compatível com OpenAI. Isso significa que, se você já usa o SDK da OpenAI, a integração tende a ser uma troca de:
-
api_key; -
base_url; -
model.
O formato de Chat Completions segue o padrão descrito na documentação da API OpenAI.
Em 22/06/2026, a URL base do Fugu não está publicada em uma página pública. Não tente adivinhar. Copie a URL real do seu painel em console.sakana.ai.
Exemplo em Python
from openai import OpenAI
client = OpenAI(
api_key="YOUR_FUGU_API_KEY",
base_url="<YOUR_FUGU_BASE_URL_FROM_CONSOLE>", # copie de console.sakana.ai
)
response = client.chat.completions.create(
model="fugu",
messages=[
{
"role": "system",
"content": "Você é um assistente de codificação preciso."
},
{
"role": "user",
"content": "Revise esta função em busca de erros de off-by-one."
},
],
)
print(response.choices[0].message.content)
Alternando para Fugu Ultra
Para usar a variante de maior qualidade, altere o ID do modelo:
response = client.chat.completions.create(
model="fugu-ultra", # verifique o ID exato no console
messages=[
{
"role": "user",
"content": "Reproduza o resultado principal deste artigo e liste os passos necessários."
},
],
)
print(response.choices[0].message.content)
Exemplo com curl
Use este formato se quiser testar rapidamente fora do SDK:
curl "<YOUR_FUGU_BASE_URL_FROM_CONSOLE>/chat/completions" \
-H "Authorization: Bearer YOUR_FUGU_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "fugu",
"messages": [
{
"role": "system",
"content": "Você é um assistente técnico objetivo."
},
{
"role": "user",
"content": "Explique os riscos de usar um orquestrador multiagente em produção."
}
]
}'
Confirme sempre os IDs exatos no console antes de enviar para produção. Para um passo a passo completo, veja o guia sobre como usar a API Sakana Fugu.
Checklist para testar o Fugu em um projeto real
Antes de considerar o Fugu para produção, execute um teste controlado:
- Escolha 10 a 30 prompts reais do seu produto ou fluxo interno.
- Execute os mesmos prompts contra Fugu, Fugu Ultra e seu modelo atual.
- Registre latência, custo e tokens por requisição.
-
Compare qualidade com critérios objetivos, como:
- resposta correta;
- citação de fontes;
- aderência ao formato;
- redução de erros;
- qualidade da verificação final.
- Separe tarefas simples de tarefas compostas. O Fugu tende a fazer mais sentido quando há decomposição real.
- Teste falhas e limites, incluindo timeouts, indisponibilidade de agentes e prompts longos.
- Valide requisitos de dados e conformidade, especialmente se você precisa excluir provedores específicos.
Como isso se encaixa no seu fluxo de trabalho Apidog
Como o Fugu usa o formato OpenAI Chat Completions, você pode testá-lo no Apidog como qualquer outro endpoint HTTP.
Fluxo prático:
- Crie uma nova requisição no Apidog.
- Configure a URL base copiada de
console.sakana.ai. - Adicione o header:
Authorization: Bearer YOUR_FUGU_API_KEY
Content-Type: application/json
- Envie o payload de Chat Completions.
- Salve a chamada como caso reutilizável.
- Duplique o caso para comparar
fugu,fugu-ultrae outros modelos.
Essa medição é especialmente importante para o Fugu. Por ser um orquestrador, latência e custo podem variar mais do que em um modelo único. Uma requisição simples pode ser respondida diretamente; uma tarefa complexa pode acionar vários agentes.
No Apidog, você pode capturar:
- tempo real de resposta;
- payload enviado;
- resposta completa;
- headers;
- casos reutilizáveis;
- variações de modelo no mesmo projeto.
Para começar, baixe o Apidog e aponte uma nova requisição para a URL base do seu console.
Perguntas frequentes
O Sakana Fugu é um modelo único ou muitos modelos?
Depende do ponto de vista. Para o seu código, ele aparece como um único modelo atrás de uma API. Internamente, é um maestro treinado que pode chamar outros modelos e sintetizar seus resultados.
Por isso, os números de benchmark devem ser lidos como resultados de modelo-de-modelos, não como vitórias diretas de um único conjunto de pesos. Para comparação com modelos únicos, veja o explicador do modelo de classe Mythos.
Qual é a diferença entre Fugu e Fugu Ultra?
Fugu é a variante equilibrada, com menor latência, indicada para tarefas diárias como codificação, revisão de código e chatbots.
Fugu Ultra prioriza qualidade máxima, com maior custo de latência, e é indicado para pesquisa, segurança e análise profunda.
Ambos usam o mesmo endpoint. Você muda apenas o ID do modelo.
O Fugu realmente supera o Opus 4.8 e o GPT 5.5?
Segundo a Sakana, o Fugu supera Gemini 3.1 Pro, Opus 4.8 e GPT 5.5 em um conjunto específico de aplicações.
A leitura correta é: o sistema orquestrado pode superar modelos individuais em certas tarefas. Isso não significa que os pesos do Fugu, isoladamente, sejam superiores aos desses modelos.
Como faço para chamar a API Fugu?
Use um cliente compatível com OpenAI, configure a base_url fornecida pelo console da Sakana, adicione sua chave e envie uma requisição no formato Chat Completions.
A URL base não é pública. Copie-a de console.sakana.ai. Veja também o guia de como usar a API Sakana Fugu.
O Fugu está disponível para todos agora?
O acesso é feito pela página do produto e pelo console.sakana.ai, com login via Google ou e-mail. A beta tinha cerca de 500 usuários no final de abril de 2026.
Verifique no console se o acesso GA é totalmente self-service e se há restrições para UE/EEA.
Como o Fugu é diferente de um roteador ou framework de agentes?
Um roteador, como OpenRouter ou Martian, escolhe um modelo e encaminha a requisição.
Um framework de agentes, como Swarm, AutoGen ou LangGraph, fornece infraestrutura, mas você escreve a lógica de coordenação.
O Fugu treina o coordenador. O próprio modelo decide quando delegar, como organizar comunicação e como sintetizar a resposta final.
Conclusão
Fugu aposta que os próximos ganhos em IA virão não apenas de modelos maiores, mas de melhores formas de coordenar modelos. Para desenvolvedores, a parte mais prática é a compatibilidade com OpenAI: você pode testar com mudanças mínimas no cliente.
A melhor forma de avaliar é simples: rode prompts reais, compare com seus modelos atuais e meça latência, custo e qualidade. Configure sua primeira chamada Fugu no Apidog, compare lado a lado com modelos únicos e deixe seus próprios dados decidirem.





Top comments (0)