Sakana Fuguの料金体系は、日常利用向けのサブスクリプションプランと、大規模なエンタープライズワークロード向けの従量課金制(PAYG)の2系統です。特徴的なのは、1回のリクエスト内で複数エージェントが実行されても、エージェントごとに個別料金が積み上がらないとされるパススルー課金です。なお、以下のドル表記は二次情報源に基づく報告値です。Sakana自身のリリースページでは料金構造は説明されていますが、具体的な金額は直接示されていません。Fuguは単一モデルとして提示されるオーケストレーションシステムであり、この構造がパススルー課金を可能にしています。
Fuguの料金体系
Fuguは、一般的なチャットモデルのように「1つのモデルにプロンプトを投げて終わり」という前提ではありません。Fuguはコンダクター(指揮者)として動作し、次のどちらを実行するかを判断します。
- 自分自身で直接回答する
- 自己の再帰的なインスタンスを含むワーカーモデル群に処理を委任する
この設計が、料金の見積もり方に影響します。
Sakanaが確認している購入パスは次の2つです。
- サブスクリプションプラン:日常業務向け。月額固定料金で、コーディング、コードレビュー、チャットボット、インタラクティブサービスなどに利用します。
- 従量課金制(PAYG):より大規模なエンタープライズワークロード向け。トークン単位で課金されるため、バッチジョブ、研究実行、トラフィックが急増するサービスに向いています。
バランス型の「Fugu」と、高品質型の「Fugu Ultra」は、どちらも1つのOpenAI互換エンドポイントの背後にあります。利用側はモデルID文字列でバリアントを選択し、Fugu側が内部でどの程度の処理能力を使うかを決めます。
独立した無料枠は報告されていません。近いものとして、後述するローンチプロモーションがあります。
実装前にコスト感を確認するなら、既存のOpenAIクライアントをFuguに向け、リクエストごとのトークン消費を記録してください。Apidogのようにリクエスト単位で確認できるツールを使うと、単一モデルAPIよりも重要な差分が見えます。Fuguでは、1回のAPI呼び出しが内部で複数モデル呼び出しに分岐する可能性があるためです。
報告されている料金:予算化する前に必ずコンソールで確認する
以下の金額は報告値です。契約や予算化に使う前に、必ずSakanaのコンソール上で最新の料金を確認してください。
報告されているサブスクリプションプラン
| プラン | 報告されている月額料金 | 主な用途 |
|---|---|---|
| エントリー | 月額20ドル(報告値) | 個人開発者、軽い日常利用 |
| ミッド | 月額100ドル(報告値) | チーム利用、継続的なコーディングおよびレビュー |
| トップ | 月額200ドル(報告値) | パワーユーザー、大量のインタラクティブサービス |
同じ段階的な料金体系が、FuguとFugu Ultraの両方に適用されると報告されています。
また、2026年7月末までに申し込むと2ヶ月目が無料になるローンチプロモーションも報告されています。ただし、この情報はリリースページでは確認されていません。プロモーションは短期間で変更される可能性があるため、判断材料にする場合はコンソールで確認してください。
報告されている従量課金レート
| トークンタイプ | 報告されている料金(100万トークンあたり) | 272Kコンテキスト超過時の報告追加料金 |
|---|---|---|
| 入力 | 5ドル(報告値) | 10ドル(報告値) |
| 出力 | 30ドル(報告値) | 45ドル(報告値) |
| キャッシュ済み入力 | 0.50ドル(報告値) | 1.00ドル(報告値) |
注意すべきは、272Kトークンを超える長文コンテキストの追加料金です。報告値では、100万トークンあたりの費用が約2倍に上がります。
Fuguのようなオーケストレーション型システムでは、コンダクターがワーカーエージェント間でコンテキストを渡すため、プロンプトと中間コンテキストが大きくなりがちです。特にFugu Ultraで研究グレードのタスクを実行する場合、想定より早く長文コンテキスト帯に入る可能性があります。
既存のフロンティアモデルとの価格感を比較したい場合は、Claude Fable 5の価格も参考になります。
パススルー課金で確認すべきポイント
パススルー課金は、「内部で複数エージェントが動いたとしても、エージェントごとの料金が別々に積み上がらない」という点が重要です。
ただし、次の点は分けて考える必要があります。
- ベースのFuguバリアントは、基盤モデルのレートに準拠すると報告されている
- Fugu Ultraや従量課金レートには、Sakanaのオーケストレーション部分のマージンが含まれる
- 難しいタスクでは、Fuguが他ベンダーのフロンティアモデルを呼び出す可能性がある
つまり、安価なコンダクター自体が請求の主因になるとは限りません。主なコスト要因は、コンダクターが呼び出すワーカーモデルです。
この点は論文上の主張とも整合します。Trinity論文では、進化的手法で最適化された2万パラメータ以下のコーディネーターが説明されています。また、Conductor論文では、強化学習で訓練された7Bモデルが、より低コストでMixture-of-Agentsを上回ると主張されています。
実務上は、次のように考えると分かりやすいです。
- 簡単なタスクが多い場合:Fugu自身が安価に処理できる可能性がある
- 難しいタスクが多い場合:高価なフロンティアモデル呼び出しが増え、コストが上がる可能性がある
- 長文コンテキストが多い場合:272K超過時の追加料金に注意する
Fuguが安くなるかどうかは、トラフィック構成に依存します。平均単価だけで判断せず、実際のリクエストで測定してください。
実際のフロンティアモデル価格との比較
Fuguの報告値だけでは判断しにくいため、公開価格が明示されているモデルと比較します。以下はAnthropicの2026年6月9日時点の価格です。
| モデル | 入力(100万トークンあたり) | 出力(100万トークンあたり) | 概要 |
|---|---|---|---|
| Fable 5 | 10ドル | 50ドル | Anthropicの最も強力な一般提供モデル、Opus 4.8の一つ上のティア |
| Mythos 5 | 10ドル | 50ドル | Fable 5と同じ価格帯 |
| Mythos Preview | 25ドル | 125ドル | 「リリースするには危険すぎる」として保留された2026年4月のフロンティアモデル |
Fuguの報告されている従量課金レートは、入力100万トークンあたり約5ドル、出力100万トークンあたり約30ドルです。表面上はFable 5より安く見えます。
ただし、ここで比較を止めると不十分です。
Sakanaは、Fugu Ultraがエンジニアリング、科学、推論のベンチマークにおいて「Fable 5やMythos Previewのような主要モデルと肩を並べる」と主張しています。これは「同等性(parity)」の主張であり、「上回る(beats)」という主張ではありません。
また、Fuguは単一モデルではなく、他ベンダーのフロンティアモデルや自身の再帰的インスタンスを呼び出すオーケストレーターです。したがって、Fuguがフロンティアグレードの回答を返した場合、その裏側ではフロンティアモデルの呼び出しと結果の合成が行われている可能性があります。
比較する際は、次の違いを意識してください。
- Fable 5やMythos:公開価格が1つの単一モデル
- Fugu:起動される内部モデルによって実効コストが変わるシステム
Fuguの導入手順については、Sakana Fuguへのアクセス方法に関するガイドも参照できます。
OpenAI互換クライアントでFuguを呼び出す
FuguはOpenAI互換エンドポイントを公開しているため、既存のOpenAI SDKを流用できます。SDK自体を大きく移行する必要はありません。
ただし、ベースURLは公開ページには掲載されていません。ログイン後にコンソールから実際のURLをコピーし、推測したホスト名をハードコードしないでください。
from openai import OpenAI
# ログイン後、console.sakana.ai から実際の base_url をコピーする
client = OpenAI(
api_key="YOUR_SAKANA_API_KEY",
base_url="<YOUR_FUGU_BASE_URL_FROM_CONSOLE>",
)
# "fugu" はバランス型のパススルー課金バリアント
# "fugu-ultra" は高品質バリアント
response = client.chat.completions.create(
model="fugu",
messages=[
{
"role": "user",
"content": "Review this function for security issues."
},
],
)
print(response.choices[0].message.content)
# コスト確認のため、必ず usage を記録する
print(response.usage)
実装時は、最低限次の情報をログに残してください。
usage = response.usage
log_record = {
"model": "fugu",
"prompt_tokens": usage.prompt_tokens,
"completion_tokens": usage.completion_tokens,
"total_tokens": usage.total_tokens,
}
print(log_record)
Fuguでは内部呼び出しが1つの使用量に集約されるため、response.usageがリクエスト単位のコストを把握する最も重要なシグナルになります。
モデルID文字列としては、fuguおよびfugu-ultraが報告されています。日付接尾辞が付く可能性もあるため、実装前にコンソールで最新のモデルIDを確認してください。
リクエストとレスポンスの形式は、標準のOpenAIチャット補完コントラクトに準拠しています。そのため、OpenAI互換プロトコルに対応したクライアントやツールであれば、既存の構成を大きく変えずに試せます。
詳細なセットアップ手順は、Sakana Fugu APIの使用方法に関するガイドを参照してください。
コスト検証の進め方
本番導入前に、次の順序で検証すると判断しやすくなります。
- コンソールで最新の料金、モデルID、ベースURLを確認する
- 既存のOpenAIクライアントの
base_urlだけをFuguに切り替える - 実際のプロンプトを小規模に流す
- 各レスポンスの
usageを保存する - 簡単なタスク、難しいタスク、長文コンテキストを分けて平均トークン数を比較する
- サブスクリプションとPAYGのどちらが合うかを判断する
たとえば、CSVやログ基盤に次のような項目を保存しておくと、後で集計できます。
{
"request_id": "req_001",
"model": "fugu",
"task_type": "code_review",
"prompt_tokens": 1200,
"completion_tokens": 800,
"total_tokens": 2000,
"context_size_bucket": "under_272k"
}
長文コンテキストを扱う場合は、under_272kとover_272kのように分類しておくと、追加料金帯に入るリクエストの割合を確認しやすくなります。
よくある質問
Fuguに無料枠はありますか?
独立した無料枠は報告されていません。最も近いオファーは、2026年7月末までに申し込むと2ヶ月目が無料になるというローンチプロモーションです。
ただし、このプロモーションはリリースページで確認されていません。利用を前提にする前に、console.sakana.aiのコンソールでリアルタイムに確認してください。
Fuguはトークンあたり安価に見えますが、なぜ費用が高くなる可能性があるのですか?
報告されているトークン単価は、コンダクターとしてのFuguに対するものです。Fuguは難しい問題を他ベンダーのモデルに委任するオーケストレーターであり、内部でフロンティアモデルが呼び出される可能性があります。
単一のフロンティアモデルには、隠れたファンアウトがない1つの公開料金があります。比較対象としては、Claude Fable 5の料金内訳が分かりやすいです。
Fuguにおけるパススルー課金とは何ですか?
ベースのFuguバリアントでは、呼び出す基盤モデルの標準レートで課金され、エージェントごとのオーケストレーション費用は別途追加されないと報告されています。
ただし、プレミアムバリアントや従量課金プランでは、Sakanaのマージンを含めて支払うことになります。
サブスクリプションと従量課金、どちらを選ぶべきですか?
安定した日常業務には、月額固定で予測しやすいサブスクリプションが向いています。例としては、コーディング、コードレビュー、チャットボット、社内ツールなどです。
一方、急増するワークロード、重いバッチ処理、研究グレードの実行には従量課金制が向いています。その場合は、約272Kトークンを超える長文コンテキストの追加料金も予算に含めてください。
Fuguのリクエスト費用を追跡するにはどうすればよいですか?
各レスポンスのusageフィールドをログに記録してください。Fuguでは、コンダクターの内部モデル呼び出しが1つのトークンカウントに集約されるためです。
また、呼び出しごとの使用量を記録できるツールを経由させると、コスト増加を可視化しやすくなります。Fuguをルーティングアグリゲーターと比較している場合は、OpenRouterの最良代替案に関するガイドも参考になります。
まとめ
Fuguの料金体系は、簡単なタスクが多く、時々難しいタスクが発生するワークロードでは有利に働く可能性があります。一方で、常にフロンティアグレードの推論を必要とするワークロードでは、内部モデル呼び出しや長文コンテキストによってコストが上がる可能性があります。
導入前にやるべきことは明確です。
- 報告値を鵜呑みにせず、コンソールで最新料金を確認する
- 実際のプロンプトで小規模テストする
-
response.usageを必ず記録する - 272Kトークン超過のリクエスト割合を確認する
- サブスクリプションとPAYGを実測値で比較する
テスト中にFuguのトークン消費をリクエストごとに監視するには、Apidogをダウンロードし、OpenAI互換の呼び出しをルーティングして確認してください。


Top comments (0)