Walse

Posted on Jun 22 • Originally published at apidog.com

Apa Itu Sakana Fugu

Sakana Fugu adalah sistem orkestrasi multi-agen dari Sakana AI yang dikirimkan sebagai satu model fondasi di balik API kompatibel OpenAI. Model ini bertindak sebagai “konduktor”: menerima satu prompt, memutuskan apakah perlu mendelegasikan pekerjaan, memanggil kumpulan LLM lain termasuk salinan rekursif dirinya sendiri, lalu menyintesis hasilnya menjadi satu jawaban. Sakana mengumumkannya pada 22 Juni 2026 lewat “One Model to Command Them All” di halaman rilis resmi. Jika Anda mengikuti rilis seperti Claude Fable 5, posisi Fugu berbeda: ia bukan solois, melainkan orkestrator.

Coba Apidog hari ini

Nama Fugu juga sesuai dengan desainnya. Fugu adalah ikan buntal Jepang: kuat, tetapi hanya aman dan berguna jika ditangani dengan benar. Analogi ini cocok untuk sistem yang nilainya bergantung pada cara ia mengoordinasikan model lain.

TL;DR

Apa itu: LLM “konduktor” yang mengorkestrasi beberapa model canggih di balik satu endpoint.
Varian: fugu untuk keseimbangan dan latensi rendah; fugu-ultra untuk kualitas jawaban maksimum.
Integrasi: API kompatibel OpenAI, sehingga klien OpenAI yang sudah ada bisa diarahkan ke endpoint Fugu.
Catatan penting: Fugu dapat memanggil model vendor lain, jadi hasil benchmark adalah hasil orkestrasi model-dari-model, bukan bukti bahwa satu model tunggal mengalahkan model lain.
Akses: Halaman produk dan console.sakana.ai dengan login Google/email.

Apa sebenarnya Sakana Fugu itu

Model fondasi biasa menjawab langsung: Anda mengirim prompt, model melakukan forward pass, lalu token dikembalikan. Fugu menambahkan lapisan orkestrasi di atas pola tersebut.

Fugu adalah model bahasa yang dilatih untuk koordinasi. Saat request masuk, Fugu dapat:

menjawab sendiri,
membagi tugas ke beberapa model,
mengatur komunikasi antar-agen,
menjalankan instans rekursif dirinya sendiri jika diperlukan,
menyatukan hasil akhir menjadi satu respons.

Dari sisi kode, Anda melihat satu model dan satu API. Dari sisi arsitektur, Fugu adalah model-dari-model. Ini penting saat membaca benchmark: angka yang terlihat sebagai “performa Fugu” bisa berasal dari tim model yang dipimpin Fugu.

Branding “Sakana” juga konsisten dengan ide ini. “Sakana” berarti “ikan” dalam bahasa Jepang, dan identitas perusahaan berpusat pada kecerdasan kolektif seperti gerombolan ikan: banyak agen kecil menghasilkan perilaku yang lebih kuat daripada satu agen tunggal.

Dua varian: Fugu dan Fugu Ultra

Sakana menyediakan dua varian melalui API yang sama.

`fugu`

Gunakan fugu untuk workload interaktif:

coding harian,
review kode,
chatbot,
layanan yang sensitif terhadap latensi,
task yang butuh respons cepat.

Varian ini sebelumnya disebut “Fugu Mini” pada masa beta. Untuk implementasi baru, gunakan nama fugu.

`fugu-ultra`

Gunakan fugu-ultra saat kualitas jawaban lebih penting daripada latensi:

penelitian AI,
reproduksi paper,
analisis keamanan siber,
investigasi literatur,
analisis paten,
tugas penalaran panjang.

Kedua varian berada di belakang endpoint yang sama. Anda memilih varian lewat model. Jika ingin perbandingan lebih rinci, lihat ulasan Fugu Ultra vs Fable 5 vs Mythos.

Tabel spesifikasi

Atribut	Detail
Vendor	Sakana AI
Dirilis	22 Juni 2026
Tipe	Sistem orkestrasi multi-agen, dikirimkan sebagai satu model fondasi
Varian	Fugu, Fugu Ultra
Nama beta lama	“Fugu Mini” untuk varian kecil
API	Satu endpoint kompatibel OpenAI
String ID model, dilaporkan	`fugu`, `fugu-ultra` [VERIFIKASI]
URL dasar	Tidak dipublikasikan umum; salin dari console.sakana.ai [VERIFIKASI 2026-06-22]
Akses	Halaman produk + console.sakana.ai
Struktur harga	Tingkatan langganan + bayar sesuai penggunaan untuk penggunaan berat/perusahaan
Silsilah penelitian	Trinity, arXiv:2512.04695; Conductor, arXiv:2512.04388; keduanya ICLR 2026

Bagaimana orkestrasi Fugu bekerja

Inti Fugu adalah konduktor terlatih, bukan router statis.

Router tradisional seperti OpenRouter atau Martian memilih satu model lalu meneruskan request. Framework agen seperti Swarm, AutoGen, atau LangGraph memberi Anda komponen untuk membangun tim, tetapi Anda tetap menulis logika koordinasinya.

Fugu berada di tengah:

Anda tetap memanggil satu endpoint.
Fugu memutuskan sendiri kapan perlu mendelegasikan.
Fugu mengatur komunikasi antar-agen.
Fugu menyintesis hasil akhir.

Menurut Sakana, konduktor Fugu menangani tiga tugas utama:

Delegasi

Memilih agen atau salinan rekursif Fugu untuk subtugas tertentu.
Komunikasi

Mengelola pesan antar-agen dan membentuk struktur tim secara dinamis.
Sintesis

Menggabungkan hasil parsial menjadi jawaban akhir yang koheren.

Ada dua mekanisme yang relevan untuk implementasi enterprise:

Agen yang dapat ditukar

Tim dapat mengecualikan model vendor tertentu karena alasan data, kebijakan, atau kepatuhan.
Perutean di sekitar pembatasan

Menurut Sakana, Fugu dapat merutekan pekerjaan ke agen lain ketika penyedia tertentu tidak tersedia atau tidak diizinkan.

Untuk konteks model tunggal yang menjadi pembanding Fugu, lihat penjelasan model kelas Mythos.

Kotak kejujuran: orkestrator, bukan model tunggal

Fugu adalah orkestrator yang dapat memanggil model canggih dari vendor lain, termasuk dirinya sendiri secara rekursif.

Saat Anda melihat hasil benchmark Fugu, hasil itu mungkin berasal dari Fugu yang memanggil Opus 4.8, Fable 5, atau beberapa model lain, lalu menyintesis output-nya. Jadi angka tersebut adalah hasil model-dari-model, bukan kemenangan satu model tunggal.

Ini penting untuk dua klaim Sakana.

Pertama, Sakana menyatakan bahwa Fugu Ultra “bersaing ketat” dengan model seperti Fable 5 dan Mythos Preview pada benchmark teknik, ilmiah, dan penalaran. Baca ini sebagai klaim kesetaraan orkestrasi, bukan bukti bahwa bobot Fugu tunggal mengalahkan model-model tersebut.

Kedua, Sakana juga menyatakan bahwa Fugu “secara konsisten mengungguli” Gemini 3.1 Pro, Opus 4.8, dan GPT 5.5 pada aplikasi spesifik seperti AutoResearch, Rubik’s Cube, desain mekanik, analisis tulisan tangan Jepang, catur sekali jalan, dan prediksi deret waktu finansial.

Namun prinsipnya tetap sama: tim yang diorkestrasi dapat mengalahkan model tunggal sambil tetap bergantung pada model tunggal tersebut.

Ini bukan kelemahan Fugu. Orkestrasi memang kemampuan nyata. Tetapi saat Anda mengevaluasinya, labeli hasilnya dengan benar.

Sebagai referensi, Fable 5 adalah model Anthropic yang tersedia umum dan diposisikan di atas Opus 4.8. Mythos Preview adalah model canggih yang Anthropic anggap terlalu berisiko untuk dirilis. Lihat penjelasan Claude Fable 5 untuk detailnya.

Silsilah penelitian: Trinity dan Conductor

Fugu tidak berdiri sendiri. Dua paper ICLR 2026 menjadi dasar konseptualnya.

Trinity

Trinity: An Evolved LLM Coordinator

arXiv:2512.04695

Paper ini menjelaskan koordinator kecil, di bawah 20.000 parameter, yang dioptimalkan lewat evolusi bebas turunan. Trinity menetapkan peran seperti:

Thinker,
Worker,
Verifier.

Poin utamanya: pengontrol kecil yang berevolusi dapat menggerakkan loop multi-agen yang berguna.

Conductor

Conductor: Learning to Orchestrate Agents in Natural Language

arXiv:2512.04388

Paper ini menjelaskan model 7B yang dilatih dengan reinforcement learning untuk mempelajari struktur komunikasi antar-agen. Paper tersebut mengklaim performa lebih baik daripada Mixture-of-Agents dengan biaya lebih rendah.

Jangan mencampuradukkan keduanya. Trinity dan Conductor memakai metode dan ukuran berbeda. Sakana juga belum memublikasikan jumlah parameter produk Fugu yang dikirimkan. Jadi spesifikasi seperti 7B, Qwen2.5, atau GRPO untuk Fugu produk harus dianggap inferensi pihak ketiga, bukan spesifikasi resmi.

Kebaruan praktis Fugu adalah: orkestrasi adaptif yang dipelajari, selektif biaya, dan dikirimkan sebagai satu endpoint.

Apa yang dilaporkan pengguna awal

Sakana membagikan dua testimoni awal.

Pertama, seorang software engineer memakai Fugu Ultra untuk review kode dan menyebut bahwa Fugu menemukan “lebih dari dua puluh” masalah pada kasus ketika alat lain hanya menandai “sekitar tiga”.

Kedua, seorang security engineer melaporkan bahwa satu instruksi terbatas dapat mendorong penilaian end-to-end: reconnaissance, probing XSS dan SQLi, serta review autentikasi, sambil tetap berada dalam scope.

Perlakukan ini sebagai anekdot vendor, bukan benchmark. Namun sinyalnya jelas: Fugu paling menarik untuk tugas yang bisa dipecah menjadi subtugas paralel lalu diverifikasi di akhir.

Jika Anda ingin membandingkan dengan model Sakana lain, lihat penjelasan Mirofish.

Menggunakan API Fugu

Fugu mengekspos endpoint kompatibel OpenAI. Artinya, jika Anda sudah memakai SDK OpenAI, perubahan integrasi utamanya adalah:

ganti base_url,
ganti API key,
pilih model Fugu.

Bentuk request Chat Completions tetap mengikuti pola dokumentasi API OpenAI.

Catatan: per 2026-06-22, URL dasar Fugu tidak dipublikasikan di halaman publik. Salin URL dasar dari dashboard Anda di console.sakana.ai.

Contoh Python dengan OpenAI SDK

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_FUGU_API_KEY",
    base_url="<YOUR_FUGU_BASE_URL_FROM_CONSOLE>",  # salin dari console.sakana.ai
)

response = client.chat.completions.create(
    model="fugu",
    messages=[
        {
            "role": "system",
            "content": "You are a precise coding assistant."
        },
        {
            "role": "user",
            "content": "Review this function for off-by-one bugs."
        },
    ],
)

print(response.choices[0].message.content)

Beralih ke Fugu Ultra

Untuk kualitas jawaban maksimum, ubah model:

response = client.chat.completions.create(
    model="fugu-ultra",  # verifikasi ID final di console
    messages=[
        {
            "role": "user",
            "content": "Reproduce the headline result from this paper."
        },
    ],
)

print(response.choices[0].message.content)

String fugu dan fugu-ultra berasal dari laporan sekunder. Verifikasi ID model final di console sebelum deploy. Untuk walkthrough lengkap, lihat panduan menggunakan API Sakana Fugu.

Menguji Fugu dengan Apidog

Karena Fugu kompatibel dengan format OpenAI Chat Completions, Anda bisa mengujinya seperti endpoint LLM lain di Apidog.

Langkah praktis:

Buat environment baru di Apidog.
Simpan URL dasar dari console Sakana sebagai variable, misalnya FUGU_BASE_URL.
Simpan API key sebagai secret atau environment variable.
Buat request POST ke endpoint Chat Completions yang disediakan console.
Tambahkan header:

Authorization: Bearer {{FUGU_API_KEY}}
Content-Type: application/json

Kirim body seperti ini:

{
  "model": "fugu",
  "messages": [
    {
      "role": "system",
      "content": "You are a precise coding assistant."
    },
    {
      "role": "user",
      "content": "Review this API handler and identify edge cases."
    }
  ]
}

Simpan request sebagai test case agar bisa digunakan ulang untuk membandingkan fugu, fugu-ultra, dan model lain.

Untuk Fugu, pengukuran langsung sangat penting. Karena ia adalah orkestrator, latensi dan biaya bisa lebih bervariasi dibanding model tunggal. Dengan Apidog, Anda dapat menangkap request, response, waktu respons, dan payload untuk membandingkan performa aktual di workload Anda sendiri.

Unduh Apidog, arahkan request ke URL dasar dari console Sakana, lalu jalankan benchmark kecil dengan prompt nyata dari aplikasi Anda.

Pertanyaan yang sering diajukan

Apakah Sakana Fugu satu model atau banyak model?

Keduanya, tergantung sudut pandang. Untuk kode Anda, Fugu terlihat seperti satu model di balik satu API. Secara internal, Fugu adalah konduktor terlatih yang dapat memanggil beberapa model canggih dan menyintesis hasilnya. Karena itu, benchmark Fugu harus dibaca sebagai hasil orkestrasi model-dari-model. Lihat juga penjelasan model kelas Mythos.

Apa perbedaan antara Fugu dan Fugu Ultra?

fugu adalah varian seimbang dan latensi rendah untuk coding, review kode, chatbot, dan workload interaktif. fugu-ultra menukar latensi dengan kualitas jawaban maksimum untuk riset, analisis keamanan, dan investigasi mendalam. Keduanya dipilih lewat ID model pada endpoint yang sama.

Apakah Fugu benar-benar mengalahkan Opus 4.8 dan GPT 5.5?

Menurut Sakana, Fugu mengungguli model tersebut pada beberapa aplikasi spesifik. Namun Fugu dapat memanggil model lain sebagai bagian dari tim. Jadi kemenangan Fugu harus dibaca sebagai kemenangan orkestrasi, bukan bukti bahwa bobot Fugu tunggal mengalahkan Opus 4.8 atau GPT 5.5.

Bagaimana cara memanggil API Fugu?

Gunakan klien kompatibel OpenAI, arahkan base_url ke URL dari console.sakana.ai, lalu kirim request Chat Completions standar. Contoh Python ada di bagian implementasi di atas. Untuk panduan lengkap, lihat panduan API Sakana Fugu.

Apakah Fugu sudah tersedia untuk semua orang?

Akses berjalan melalui halaman produk dan console.sakana.ai dengan login Google atau email. Beta dilaporkan berjalan dengan sekitar 500 pengguna sejak akhir April 2026. Untuk status GA, batasan wilayah, dan detail akses terbaru, cek langsung di console.

Bagaimana Fugu berbeda dari router atau framework agen?

Router memilih satu model lalu meneruskan request. Framework agen memberi Anda komponen untuk membangun tim, tetapi Anda tetap menulis logika koordinasi. Fugu melatih koordinator itu sendiri: model memutuskan delegasi, komunikasi, dan sintesis, lalu mengeksposnya sebagai satu endpoint.

Penutup

Fugu adalah taruhan bahwa peningkatan berikutnya datang dari cara model bekerja sama, bukan hanya dari bobot yang lebih besar. Untuk developer, cara mengevaluasinya sederhana: jalankan prompt produksi Anda sendiri, ukur latensi, biaya, dan kualitas jawaban, lalu bandingkan dengan model tunggal yang sudah Anda pakai.

Siapkan request pertama di Apidog, uji fugu dan fugu-ultra, lalu biarkan data workload Anda menentukan apakah premium orkestrasi Fugu layak digunakan.

DEV Community