DEV Community

Cover image for Como Testar a API Sakana Fugu no Apidog
Lucas
Lucas

Posted on • Originally published at apidog.com

Como Testar a API Sakana Fugu no Apidog

Para testar a API Sakana Fugu no Apidog, crie uma solicitação HTTP POST para o endpoint /chat/completions compatível com OpenAI, adicione Authorization: Bearer <sua-chave> e envie um payload com o modelo fugu ou fugu-ultra. Como o Fugu expõe um endpoint compatível com OpenAI, você pode usar o mesmo formato de chat sem trocar de SDK. No Apidog, você consegue salvar variantes de solicitação, inspecionar streaming SSE, comparar respostas e medir latência em uma única interface.

Experimente o Apidog hoje

Se você quer integrar via código em vez de testar manualmente no Apidog, veja o guia complementar sobre como usar a API Sakana Fugu. Este artigo foca no fluxo de teste e observação dentro do Apidog.

O que você está testando com o Fugu

Fugu não é apenas um modelo de chat. Segundo a Sakana, ele é um sistema de orquestração multiagente apresentado como um único modelo por trás de uma API. Um modelo de linguagem especializado coordena delegação, comunicação entre agentes e síntese de resultados, podendo chamar múltiplos LLMs, inclusive instâncias recursivas de si mesmo.

Para o contexto conceitual, veja também o explicador sobre o que é o Sakana Fugu.

Diagrama mostrando o modelo Fugu da Sakana como um orquestrador multiagente, delegando tarefas a outros LLMs e até mesmo a si mesmo recursivamente.

Esse design muda o que vale a pena medir. Em um modelo comum, você observa principalmente qualidade, tokens e tempo de resposta. No Fugu, a latência também pode indicar se houve uma resposta direta ou um salto de orquestração. O objeto usage mostra o custo de tokens da chamada pai, mas não revela necessariamente todos os modelos downstream que podem ter sido chamados.

As duas variantes usam o mesmo endpoint:

  • Fugu: variante balanceada e de baixa latência para codificação, revisão de código, chatbots e serviços interativos.
  • Fugu Ultra: variante focada em maior qualidade de resposta para pesquisa em IA, reprodução de artigos, análise de segurança cibernética e investigação de literatura ou patentes.

A versão beta e parte da cobertura inicial chamaram a variante menor de “Fugu Mini”. A página de lançamento usa “Fugu” e “Fugu Ultra”, então prefira esses nomes.

Obtenha a URL base e a chave

O Fugu exige login. Acesse console.sakana.ai com Google ou e-mail e copie:

  • sua chave de API;
  • a URL base exibida no console.

Nota em 22/06/2026: a URL base não estava publicada em uma página pública da Sakana. Não tente adivinhar o host. Copie o valor real do console.

Neste guia, substitua:

<SUA_URL_BASE_FUGU_DO_CONSOLE>
Enter fullscreen mode Exit fullscreen mode

pela URL base exibida no console.

Também vale verificar no console as condições atuais de acesso, disponibilidade por região e eventuais restrições da UE/EEE, pois o acesso mudou de um beta limitado para disponibilidade mais ampla.

Configure a solicitação Fugu no Apidog

Crie um novo projeto no Apidog e adicione uma nova solicitação HTTP.

1. Crie variáveis de ambiente

Não cole segredos diretamente na URL ou no corpo da requisição. Crie um ambiente, por exemplo Fugu Prod, com duas variáveis:

Variável Valor
fugu_base_url URL base copiada do console
fugu_key chave de API copiada do console

Depois disso, use:

{{fugu_base_url}}/chat/completions
Enter fullscreen mode Exit fullscreen mode

como URL da solicitação e:

Bearer {{fugu_key}}
Enter fullscreen mode Exit fullscreen mode

como valor do cabeçalho Authorization.

Esse padrão é o mesmo usado em outros provedores compatíveis com OpenAI via gateway, como no passo a passo do Claude Code com OpenRouter: você troca URL base e token, mas mantém o formato da chamada.

2. Configure método, URL e headers

Use:

POST {{fugu_base_url}}/chat/completions
Enter fullscreen mode Exit fullscreen mode

Headers:

Authorization: Bearer {{fugu_key}}
Content-Type: application/json
Enter fullscreen mode Exit fullscreen mode

3. Envie um payload básico

No corpo JSON, use o formato padrão de chat compatível com OpenAI:

{
  "model": "fugu",
  "messages": [
    {
      "role": "system",
      "content": "Você é um assistente de teste de API conciso."
    },
    {
      "role": "user",
      "content": "Resuma o que é um delta SSE em duas frases."
    }
  ],
  "stream": false
}
Enter fullscreen mode Exit fullscreen mode

A estrutura segue a referência de chat completions da OpenAI. Os IDs de modelo mencionados no lançamento são fugu e fugu-ultra, possivelmente com variações datadas como fugu-ultra-20260615. Confirme o ID exato no console antes de fixar um nome em produção.

Envie a solicitação. A resposta deve conter um objeto de conclusão de chat com choices e usage.

Salve essa solicitação como:

Fugu balanceado
Enter fullscreen mode Exit fullscreen mode

Crie uma variante para Fugu Ultra

Duplique a solicitação salva e altere apenas o campo model:

{
  "model": "fugu-ultra",
  "messages": [
    {
      "role": "user",
      "content": "Reproduza o resultado principal do artigo do coordenador Trinity em linguagem simples e note uma limitação."
    }
  ],
  "stream": false
}
Enter fullscreen mode Exit fullscreen mode

Salve como:

Fugu Ultra
Enter fullscreen mode Exit fullscreen mode

Agora você tem duas solicitações salvas para o mesmo endpoint, diferenciadas apenas pelo modelo. Isso permite testar o mesmo prompt nas duas variantes e comparar:

  • resposta;
  • latência;
  • contagem de tokens;
  • estabilidade entre execuções.

O Apidog mantém histórico de respostas por solicitação, o que ajuda a reexecutar os mesmos testes e observar variações. Para cenários com múltiplas chamadas encadeadas, veja o guia de orquestração de teste de API.

Inspecione streaming SSE

Para testar streaming, altere stream para true:

{
  "model": "fugu-ultra",
  "messages": [
    {
      "role": "user",
      "content": "Analise uma abertura de xadrez de um só golpe, passo a passo."
    }
  ],
  "stream": true
}
Enter fullscreen mode Exit fullscreen mode

Com streaming ativado, a resposta vem como:

text/event-stream
Enter fullscreen mode Exit fullscreen mode

e chega em blocos data:. Um fluxo típico se parece com isto:

data: {"id":"chatcmpl-xxx","object":"chat.completion.chunk","choices":[{"index":0,"delta":{"content":"O"},"finish_reason":null}]}

data: {"id":"chatcmpl-xxx","object":"chat.completion.chunk","choices":[{"index":0,"delta":{"content":" siciliano"},"finish_reason":null}]}

data: [DONE]
Enter fullscreen mode Exit fullscreen mode

O objeto delta contém o conteúdo incremental. Em geral:

  1. o primeiro bloco pode trazer o role;
  2. os blocos seguintes trazem fragmentos de content;
  3. o fluxo termina com finish_reason e data: [DONE].

No Apidog, observe especialmente o tempo até o primeiro delta. Uma pausa maior antes dos primeiros tokens, seguida de um fluxo estável, pode indicar que o Fugu montou uma equipe de agentes antes de responder. A variante balanceada tende a iniciar mais cedo, pois é otimizada para baixa latência.

Leia o objeto usage

Para chamadas sem streaming, abra o bloco usage na resposta:

{
  "usage": {
    "prompt_tokens": 38,
    "completion_tokens": 412,
    "total_tokens": 450
  }
}
Enter fullscreen mode Exit fullscreen mode

Esses valores representam a contabilidade da sua chamada ao Fugu. Como o Fugu é um orquestrador que pode chamar outros modelos, inclusive recursivamente a si mesmo, o usage exibido não deve ser interpretado como uma visão completa de todos os custos internos downstream.

Segundo a Sakana, a estrutura de preços é baseada em camadas de assinatura para uso diário, além de um plano de pagamento conforme o uso para cargas mais pesadas e corporativas.

Como referência externa, as taxas publicadas da Anthropic em 09/06/2026 colocavam Fable 5 e Mythos 5 em US$10 por 1M de tokens de entrada e US$50 por 1M de tokens de saída. O guia da API Claude Fable 5 mostra como testar esse endpoint se você quiser comparar um modelo único com o Fugu no mesmo projeto Apidog.

Meça a latência entre Fugu e Fugu Ultra

Para comparar as variantes:

  1. abra a solicitação Fugu balanceado;
  2. envie um prompt;
  3. anote o tempo de resposta exibido pelo Apidog;
  4. envie o mesmo prompt em Fugu Ultra;
  5. compare tempo, resposta e usage.

Normalmente, a variante balanceada deve retornar mais rápido. Segundo a Sakana, o fugu balanceado mira baixa latência e serviços interativos, enquanto o fugu-ultra prioriza qualidade em tarefas de pesquisa.

A diferença de latência é um dos sinais mais visíveis do salto de orquestração. Quando o Ultra demora mais, esse tempo extra pode representar coordenação entre agentes em vez de uma única passagem direta.

Para estressar a diferença, use tarefas citadas pela própria Sakana, como:

  • AutoPesquisa;
  • design mecânico;
  • previsão de séries temporais financeiras;
  • xadrez de um só golpe.

Segundo a Sakana, o Fugu supera consistentemente Gemini 3.1 Pro, Opus 4.8 e GPT 5.5 nessas aplicações específicas. Interprete essa afirmação com cuidado: como o Fugu pode chamar esses próprios modelos e sintetizar saídas, um resultado que “supera o Opus 4.8” pode ser um resultado de orquestração entre modelos, não uma vitória de um modelo único isolado.

A Sakana também posiciona o Fugu Ultra lado a lado com Fable 5 e Mythos Preview em benchmarks de engenharia e raciocínio, o que deve ser lido como uma afirmação de paridade, não necessariamente de superação. Teste com seus próprios prompts e critérios.

Investigue roteamento e governança de agentes

A página de lançamento do Fugu descreve mecanismos que valem testar quando disponíveis no console:

  • agentes no pool podem ser substituíveis;
  • equipes podem excluir agentes específicos por requisitos de dados ou conformidade;
  • o Fugu pode rotear dinamicamente em torno de restrições de provedores.

Se o console expuser controles de pool de agentes, altere os modelos elegíveis e reexecute suas solicitações salvas no Apidog. Compare:

  • mudanças de resposta;
  • tempo até o primeiro token;
  • latência total;
  • contagem de tokens;
  • consistência entre execuções.

A linhagem de pesquisa é documentada em dois artigos da ICLR 2026:

Não confunda os dois: eles usam métodos e tamanhos diferentes. Também evite inferir que qualquer contagem específica de parâmetros desses artigos corresponde diretamente ao produto entregue, pois isso não é um número oficial do produto.

Como encaixar isso no fluxo de trabalho do Apidog

O ganho de usar o Apidog em vez de um curl isolado é repetibilidade.

Com o projeto configurado, você consegue:

  • salvar Fugu balanceado e Fugu Ultra;
  • manter URL base e chave em variáveis de ambiente;
  • trocar staging e produção por ambiente;
  • reexecutar os mesmos prompts;
  • comparar histórico de respostas;
  • observar usage;
  • medir latência;
  • inspecionar streaming SSE.

Quando o Fugu rotacionar um ID de modelo ou você trocar de chave, basta atualizar a variável de ambiente. As solicitações salvas continuam usando o mesmo template.

Captura de tela do Apidog mostrando duas solicitações Fugu salvas, 'Fugu balanced' e 'Fugu Ultra', prontas para comparação.

Sakana vem da palavra japonesa para peixe, e a metáfora do “cardume” combina com um orquestrador que coordena muitos modelos para formar uma única resposta. Fugu, o baiacu, também sugere preparação cuidadosa: uma boa analogia para roteamento entre agentes, desde que você trate isso como contexto de marca, não como benchmark.

Aponte suas solicitações compatíveis com OpenAI para o Fugu, salve as variantes e use o Apidog para observar como o orquestrador se comporta sob diferentes prompts.

Perguntas Frequentes

Que URL base devo usar para testar o Fugu no Apidog?

Copie a URL base em console.sakana.ai após fazer login. Até 22/06/2026, a Sakana não havia publicado o host em uma página pública. Armazene essa URL como variável de ambiente no Apidog e use:

{{fugu_base_url}}/chat/completions
Enter fullscreen mode Exit fullscreen mode

Preciso de um SDK especial para chamar o Fugu?

Não. O Fugu oferece um endpoint compatível com OpenAI. Qualquer cliente ou ferramenta que use o formato de chat OpenAI pode funcionar com mudança de URL base e chave. O mesmo padrão aparece no guia Claude Code com OpenRouter.

Como testar respostas de streaming do Fugu?

Defina:

"stream": true
Enter fullscreen mode Exit fullscreen mode

A resposta chega como text/event-stream, com blocos data: contendo deltas incrementais, e termina com:

data: [DONE]
Enter fullscreen mode Exit fullscreen mode

O Apidog renderiza o fluxo SSE ao vivo, permitindo observar os deltas em tempo real.

Qual é a diferença entre Fugu e Fugu Ultra?

fugu é a variante balanceada e de baixa latência para codificação, revisão e chatbots. fugu-ultra prioriza qualidade de resposta para pesquisa, reprodução de artigos e análise de segurança. Ambos usam o mesmo endpoint e mudam apenas pelo campo model.

Por que Fugu Ultra é mais lento?

A latência extra pode refletir o salto de orquestração. Segundo a Sakana, o Fugu pode responder diretamente ou coordenar uma equipe de modelos. O Ultra tende a usar coordenação mais profunda para priorizar qualidade, então o tempo de resposta pode ser maior.

As vitórias de benchmark do Fugu são resultados de um único modelo?

Não necessariamente. O Fugu é um orquestrador que pode chamar modelos de outros fornecedores, inclusive recursivamente a si mesmo. Portanto, um resultado que “supera o Opus 4.8”, segundo a Sakana, pode ser resultado de um sistema de modelos coordenados, não de um único modelo isolado. Teste com seus próprios prompts antes de tirar conclusões.

Top comments (0)