<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/">
  <channel>
    <title>DEV Community: Akira</title>
    <description>The latest articles on DEV Community by Akira (@aakira).</description>
    <link>https://dev.to/aakira</link>
    <image>
      <url>https://media2.dev.to/dynamic/image/width=90,height=90,fit=cover,gravity=auto,format=auto/https:%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Fuser%2Fprofile_image%2F3816151%2Fbb126af7-07b9-4483-91c4-7f4ccabb61f5.png</url>
      <title>DEV Community: Akira</title>
      <link>https://dev.to/aakira</link>
    </image>
    <atom:link rel="self" type="application/rss+xml" href="https://dev.to/feed/aakira"/>
    <language>en</language>
    <item>
      <title>Claudeマネージドエージェント vs Agent SDK (2026年): 選び方</title>
      <dc:creator>Akira</dc:creator>
      <pubDate>Tue, 19 May 2026 10:25:32 +0000</pubDate>
      <link>https://dev.to/aakira/claudemanezidoeziento-vs-agent-sdk-2026nian-xuan-bifang-3jcc</link>
      <guid>https://dev.to/aakira/claudemanezidoeziento-vs-agent-sdk-2026nian-xuan-bifang-3jcc</guid>
      <description>&lt;p&gt;Claude で本番環境向けの AI エージェントを出荷する場合、最初に決めるべきことは「エージェントループをどこで動かすか」です。Anthropic に Claude マネージドエージェントでループとサンドボックスをホストさせるのか、それとも Claude エージェント SDK を使って自分のプロセス内で実行するのか。この選択は、アーキテクチャ、コスト、データレジデンシー、オンコール体制に直接影響します。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;今すぐ Apidog を試す&lt;/a&gt;
&lt;/p&gt;

&lt;h2&gt;
  
  
  結論
&lt;/h2&gt;

&lt;p&gt;次の基準で選びます。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Claude マネージドエージェント&lt;/strong&gt;: Anthropic にエージェントループ、サンドボックス、セッション状態をホストさせたい場合。長時間実行される非同期ジョブや、インフラ運用よりランタイム料金を支払う方が合理的な場合に向いています。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Claude エージェント SDK&lt;/strong&gt;: ループを自社プロセス内に保持し、ツール実行、データレジデンシー、監査、コスト構造を細かく制御したい場合に向いています。&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;どちらも MCP と Claude モデルに対応しています。違いは「モデル」ではなく「運用責任の境界」です。&lt;/p&gt;

&lt;h2&gt;
  
  
  はじめに
&lt;/h2&gt;

&lt;p&gt;2026年に「AI エージェントを構築する」と言う場合、それは単にチャット補完の周りに &lt;code&gt;while&lt;/code&gt; ループを書くことではありません。実際の本番エージェントは、決済 API、チケット管理 API、在庫サービス、社内検索 API、MCP サーバーなどを呼び出して作業します。&lt;/p&gt;

&lt;p&gt;つまり、エージェントの信頼性はモデルだけでなく、&lt;strong&gt;エージェントが呼び出す API とツールの信頼性&lt;/strong&gt;に依存します。&lt;/p&gt;

&lt;p&gt;Claude で本番エージェントを作る場合、主な選択肢は2つです。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Claude マネージドエージェント&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Anthropic がエージェントループ、サンドボックス、セッションをホストする REST API。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Claude エージェント SDK&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Python または TypeScript のライブラリとして、自社プロセス内でエージェントループを実行する方式。&lt;/p&gt;&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;どちらを選ぶ場合でも、エージェントが呼び出す API は事前にモック、契約テスト、デバッグしておくべきです。たとえば &lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt; を使えば、エージェントが依存する API をモックし、契約テストを実行し、MCP サーバーをエージェントと同じ呼び出し方で検証できます。&lt;/p&gt;

&lt;p&gt;ホスト型側を詳しく確認したい場合は、&lt;a href="http://apidog.com/blog/claude-managed-agents-guide?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Claude マネージドエージェントガイド&lt;/a&gt;も参考になります。&lt;/p&gt;

&lt;h2&gt;
  
  
  Claude マネージドエージェントとは
&lt;/h2&gt;

&lt;p&gt;Claude マネージドエージェントは、Anthropic が管理するインフラ上で動くホスト型エージェントランタイムです。自分でエージェントループ、サンドボックス、ツール実行レイヤーを作る代わりに、エージェント定義を作成し、Anthropic に実行させます。&lt;/p&gt;

&lt;p&gt;2026年4月にパブリックベータとして提供され、リクエストには &lt;code&gt;managed-agents-2026-04-01&lt;/code&gt; ベータヘッダーが必要です。SDK 利用時はこのヘッダーが自動設定されます。&lt;/p&gt;

&lt;h3&gt;
  
  
  基本概念
&lt;/h3&gt;

&lt;p&gt;Claude マネージドエージェントは、次の4つで構成されます。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;エージェント&lt;/strong&gt;: モデル、システムプロンプト、ツール、MCP サーバー、スキルの定義。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;環境&lt;/strong&gt;: Python、Node.js、Go などのパッケージやネットワークルールを含むコンテナテンプレート。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;セッション&lt;/strong&gt;: 環境内で実行されるエージェントインスタンス。タスク、会話履歴、永続ファイルシステムを持ちます。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;イベント&lt;/strong&gt;: アプリとエージェント間で流れるメッセージ。ユーザー入力、ツール結果、ステータス更新などを SSE でストリーミングします。&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  実装フロー
&lt;/h3&gt;

&lt;p&gt;基本的な流れは以下です。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;エージェントを作成する&lt;/li&gt;
&lt;li&gt;実行環境を設定する&lt;/li&gt;
&lt;li&gt;セッションを開始する&lt;/li&gt;
&lt;li&gt;ユーザーメッセージをイベントとして送信する&lt;/li&gt;
&lt;li&gt;応答やツール要求をストリーミングで受け取る&lt;/li&gt;
&lt;li&gt;必要に応じて追加イベントを送信し、実行中のエージェントを制御する&lt;/li&gt;
&lt;li&gt;イベント履歴を取得して監査やデバッグに使う&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;マネージドエージェントは、Bash、ファイル操作、WebSearch、WebFetch、MCP サーバー接続などの組み込みツールを提供します。&lt;/p&gt;

&lt;p&gt;向いているワークロードは以下です。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;数分から数時間動く非同期タスク&lt;/li&gt;
&lt;li&gt;多数のツール呼び出しを含む処理&lt;/li&gt;
&lt;li&gt;クラウドサンドボックスで安全に実行したい処理&lt;/li&gt;
&lt;li&gt;インフラ運用を最小化したいチーム&lt;/li&gt;
&lt;li&gt;会話間で状態を保持したいセッション型ワークロード&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;AWS 上の Claude Platform でも利用できますが、機能可用性やセッション動作に違いがあるため、クラウド制約がある場合は公式ドキュメントで確認してください。&lt;/p&gt;

&lt;h3&gt;
  
  
  注意点
&lt;/h3&gt;

&lt;p&gt;カスタムツールの扱いは SDK と異なります。Claude はツール呼び出しを要求しますが、実行するのはアプリケーション側です。結果はイベントストリーム経由で返します。つまり、ループとサンドボックスはホストされますが、実際のカスタムツール実行は自社環境に残ります。&lt;/p&gt;

&lt;p&gt;また、成果物やマルチエージェントなど一部の機能は研究プレビューとして別途アクセス申請が必要です。ベータ機能を前提に本番設計しないようにしてください。&lt;/p&gt;

&lt;p&gt;エージェント設計全体の考え方は、&lt;a href="http://apidog.com/blog/agentic-ai-architecture?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;エージェント AI アーキテクチャに関する記事&lt;/a&gt;でも整理されています。&lt;/p&gt;

&lt;h2&gt;
  
  
  Claude エージェント SDK とは
&lt;/h2&gt;

&lt;p&gt;Claude エージェント SDK は、Claude Code を支えるエージェントループ、ツール、コンテキスト管理を Python または TypeScript から使えるライブラリです。以前は Claude Code SDK と呼ばれていましたが、コーディング以外のエージェント用途も対象にするため名称変更されました。&lt;/p&gt;

&lt;p&gt;インストールは以下です。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;pip &lt;span class="nb"&gt;install &lt;/span&gt;claude-agent-sdk
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;または&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;npm &lt;span class="nb"&gt;install&lt;/span&gt; @anthropic-ai/claude-agent-sdk
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;API キーを設定すると、エージェントループは自社プロセス内で実行されます。&lt;/p&gt;

&lt;h3&gt;
  
  
  最小構成の考え方
&lt;/h3&gt;

&lt;p&gt;Python では、プロンプトと利用可能なツールを含むオプションを渡して &lt;code&gt;query()&lt;/code&gt; を呼び出し、ストリーミングされたメッセージを処理します。&lt;/p&gt;

&lt;p&gt;通常のクライアント SDK では、次のようなツール実行ループを自分で書く必要があります。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight python"&gt;&lt;code&gt;&lt;span class="k"&gt;while&lt;/span&gt; &lt;span class="n"&gt;response&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;stop_reason&lt;/span&gt; &lt;span class="o"&gt;==&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;tool_use&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;
    &lt;span class="c1"&gt;# ツール呼び出しを解析
&lt;/span&gt;    &lt;span class="c1"&gt;# 自分でツールを実行
&lt;/span&gt;    &lt;span class="c1"&gt;# 結果を Claude に返す
&lt;/span&gt;    &lt;span class="k"&gt;pass&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Claude エージェント SDK は、このループ、ツール実行、コンテキスト管理をライブラリとして提供します。&lt;/p&gt;

&lt;h3&gt;
  
  
  SDK が提供する主な機能
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;組み込みツール&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Read、Write、Edit、Bash、Glob、Grep、WebSearch、WebFetch、バックグラウンドスクリプト監視、AskUserQuestion など。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;フック&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
&lt;code&gt;PreToolUse&lt;/code&gt;、&lt;code&gt;PostToolUse&lt;/code&gt;、&lt;code&gt;Stop&lt;/code&gt;、&lt;code&gt;SessionStart&lt;/code&gt;、&lt;code&gt;SessionEnd&lt;/code&gt;、&lt;code&gt;UserPromptSubmit&lt;/code&gt; などのライフサイクルポイントでコールバックを実行できます。監査、ログ、ポリシー適用、ブロック処理に使えます。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;サブエージェント&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
専門タスク用のエージェントを生成できます。メッセージには &lt;code&gt;parent_tool_use_id&lt;/code&gt; が含まれるため、どのサブエージェントが何をしたかを追跡できます。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;MCP 対応&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Model Context Protocol 経由で、データベース、ブラウザ、内部 API などを接続できます。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;権限管理&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
安全なツールを事前承認し、危険なツールをブロックし、機密アクションには承認を要求できます。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;セッション管理&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
セッション ID を保存して後から再開したり、フォークして別の選択肢を検証したりできます。状態はファイルシステム上の JSONL として保持されるため、自社で所有できます。&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;SDK は Claude Code のファイルシステム設定も読み取れます。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;.claude/skills/
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;





&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;CLAUDE.md
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;また、Anthropic API だけでなく、Amazon Bedrock、AWS 上の Claude Platform、Google Vertex AI、Azure AI Foundry 経由の認証もサポートします。既存のクラウド契約内で推論を維持したい場合に重要です。&lt;/p&gt;

&lt;p&gt;実装から始めたい場合は、&lt;a href="http://apidog.com/blog/claude-agent-sdk-with-claude-plan-setup-guide?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Claude プランで Claude エージェント SDK をセットアップするガイド&lt;/a&gt;や、&lt;a href="http://apidog.com/blog/build-your-own-claude-code?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;独自の Claude Code を構築するウォークスルー&lt;/a&gt;が参考になります。&lt;/p&gt;

&lt;h3&gt;
  
  
  請求に関する注意
&lt;/h3&gt;

&lt;p&gt;2026年6月15日以降、Agent SDK と&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;claude &lt;span class="nt"&gt;-p&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;のサブスクリプションプランでの使用は、対話型利用制限とは別の月額 Agent SDK クレジットから引き落とされます。&lt;/p&gt;

&lt;p&gt;料金や制限は変わる可能性があります。ブログ記事内の数値ではなく、Anthropic の最新規約を直接確認してください。&lt;/p&gt;

&lt;h2&gt;
  
  
  直接比較: マネージドエージェント vs エージェント SDK
&lt;/h2&gt;

&lt;p&gt;コストを見積もる前に、&lt;a href="https://www.anthropic.com/pricing" rel="noopener noreferrer"&gt;Anthropic の料金ページ&lt;/a&gt;と&lt;a href="https://platform.claude.com/docs/en/managed-agents/overview" rel="noopener noreferrer"&gt;マネージドエージェントのドキュメント&lt;/a&gt;を確認してください。&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;要素&lt;/th&gt;
&lt;th&gt;Claude マネージドエージェント&lt;/th&gt;
&lt;th&gt;Claude エージェント SDK&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;ループの実行場所&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Anthropic 管理インフラ&lt;/td&gt;
&lt;td&gt;自社プロセス、自社インフラ&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;インターフェース&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;REST API + SSE イベントストリーム&lt;/td&gt;
&lt;td&gt;Python または TypeScript ライブラリ&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;制御性&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;設定とイベントで制御&lt;/td&gt;
&lt;td&gt;フック、権限、インプロセスロジックで細かく制御&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;コストモデル&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Claude トークン料金 + アクティブセッション時間のランタイム料金&lt;/td&gt;
&lt;td&gt;Claude トークン料金 + 自社で実行するコンピューティング費用&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;運用負担&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;低い。サンドボックス、スケーリング、セッションストアを運用しない&lt;/td&gt;
&lt;td&gt;高い。サービス、サンドボックス、監視、スケーリングを自社で運用&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;可観測性&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;ホスト型イベントログを取得可能&lt;/td&gt;
&lt;td&gt;フック、ログ、トレーシングを自社で実装&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;レイテンシ&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;ホスト型ランタイムへのネットワークホップあり&lt;/td&gt;
&lt;td&gt;ツールやデータに近い場所で実行可能&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;データレジデンシー&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;サンドボックスとセッション状態は Anthropic 側、または AWS オプション&lt;/td&gt;
&lt;td&gt;ファイル、状態、ツール実行を自社環境に保持&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;カスタムツール実行&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Claude が要求し、アプリが実行して結果を返す&lt;/td&gt;
&lt;td&gt;Python / TypeScript 関数としてインプロセス実行&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;向いている用途&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;長時間実行、非同期、インフラ軽量な本番エージェント&lt;/td&gt;
&lt;td&gt;ローカルプロトタイプ、厳格なデータ制御、内部サービスに近いエージェント&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;h3&gt;
  
  
  コスト
&lt;/h3&gt;

&lt;p&gt;マネージドエージェントは、標準の Claude トークン料金に加えて、アクティブなセッション時間に対するランタイム料金が発生します。ツール呼び出しの間に待機している時間も、アクティブセッションとして課金対象になる可能性があります。&lt;/p&gt;

&lt;p&gt;SDK には Anthropic の時間単位ランタイム料金はありません。ただし、自社サーバー、オートスケーリング、サンドボックス、監視、オンコール運用のコストが発生します。&lt;/p&gt;

&lt;p&gt;紙の上で SDK が安く見えても、運用負荷まで含めると逆転することがあります。&lt;/p&gt;

&lt;h3&gt;
  
  
  運用負担
&lt;/h3&gt;

&lt;p&gt;マネージドエージェントは、サンドボックス、セッションストア、スケーリングを Anthropic 側に寄せられます。小規模チームや非同期ジョブ中心のサービスでは大きな利点です。&lt;/p&gt;

&lt;p&gt;SDK はその逆です。すべてを制御できますが、すべてを運用する必要があります。VPC 内でプライベート DB に接続する必要がある場合や、既存の監査基盤と密に統合したい場合に向いています。&lt;/p&gt;

&lt;h3&gt;
  
  
  データレジデンシー
&lt;/h3&gt;

&lt;p&gt;SDK を使う場合、ツール実行とセッション状態は自社インフラ内に残ります。Claude に送られるのはモデル推論に必要な情報です。&lt;/p&gt;

&lt;p&gt;マネージドエージェントでは、サンドボックスとイベントログが Anthropic の環境、または条件付きで AWS 側に存在します。規制対象データを扱う場合、この一点だけで SDK を選ぶことがあります。&lt;/p&gt;

&lt;h3&gt;
  
  
  可観測性
&lt;/h3&gt;

&lt;p&gt;マネージドエージェントは、取得可能なホスト型イベントログを提供します。&lt;/p&gt;

&lt;p&gt;SDK はフックを提供しますが、ログ、トレース、監査基盤への接続は自社実装です。柔軟性は高いですが、初期実装の手間があります。&lt;/p&gt;

&lt;h2&gt;
  
  
  エージェントが呼び出す API のテストとデバッグ
&lt;/h2&gt;

&lt;p&gt;ホスティング方式に関係なく、エージェントの信頼性は API と MCP サーバーに依存します。&lt;/p&gt;

&lt;p&gt;たとえば、推論は正しくても、決済 API が不安定であれば返金エージェントは不安定です。出荷前に次の3レイヤーをテストしてください。&lt;/p&gt;

&lt;h3&gt;
  
  
  1. API 契約
&lt;/h3&gt;

&lt;p&gt;エージェントが呼び出すすべてのツールは、スキーマを持つ API として扱います。&lt;/p&gt;

&lt;p&gt;やること:&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;エンドポイントをモックする&lt;/li&gt;
&lt;li&gt;リクエストスキーマを定義する&lt;/li&gt;
&lt;li&gt;レスポンススキーマを定義する&lt;/li&gt;
&lt;li&gt;正常系と異常系を契約テストする&lt;/li&gt;
&lt;li&gt;CI またはスケジュール実行で回す&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt; を使うと、決済サービスやチケットサービスのモックを作成し、エージェントが期待するスキーマを定義し、契約テストを継続実行できます。&lt;/p&gt;

&lt;p&gt;具体的な失敗モードは、&lt;a href="http://apidog.com/blog/how-to-test-ai-agents-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;API を呼び出す AI エージェントのテスト方法に関するガイド&lt;/a&gt;で解説されています。&lt;/p&gt;

&lt;h3&gt;
  
  
  2. MCP サーバー
&lt;/h3&gt;

&lt;p&gt;マネージドエージェントも SDK も、外部ツールを MCP 経由で接続できます。MCP サーバー自体も API サービスです。&lt;/p&gt;

&lt;p&gt;検証すべき点:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;公開されているツール一覧&lt;/li&gt;
&lt;li&gt;各ツールの入力スキーマ&lt;/li&gt;
&lt;li&gt;各ツールの出力スキーマ&lt;/li&gt;
&lt;li&gt;タイムアウト時の挙動&lt;/li&gt;
&lt;li&gt;エラー時のレスポンス形式&lt;/li&gt;
&lt;li&gt;エージェントが扱いやすい構造化データになっているか&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;a href="http://apidog.com/blog/mcp-server-testing-apidog?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog を使用した MCP サーバーのテスト&lt;/a&gt;では、MCP サーバーが公開するツールを列挙し、それぞれを直接試す方法が説明されています。&lt;/p&gt;

&lt;p&gt;Apidog には AI エージェントと A2A デバッガーも含まれているため、エージェントが生成するリクエストとレスポンスを実際に確認できます。&lt;/p&gt;

&lt;h3&gt;
  
  
  3. エージェント自身のリクエストパターン
&lt;/h3&gt;

&lt;p&gt;エージェントは人間とは違う呼び出し方をします。&lt;/p&gt;

&lt;p&gt;よくあるパターン:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;短時間で同じ API を複数回呼ぶ&lt;/li&gt;
&lt;li&gt;失敗時に過剰リトライする&lt;/li&gt;
&lt;li&gt;部分的な情報だけで検索 API を叩く&lt;/li&gt;
&lt;li&gt;推論ループ中に同じエンドポイントを繰り返し呼ぶ&lt;/li&gt;
&lt;li&gt;504 後に成功済み操作を再実行する&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;本番前に、モック API に対して現実的なチケットや履歴データをリプレイし、エージェントが実際に送るリクエストを観察してください。&lt;/p&gt;

&lt;p&gt;マネージドエージェントではループが隠れるため、イベントログと API レベルのテストが重要です。SDK ではフックでループを計測できますが、それでも API 契約テストは必要です。&lt;/p&gt;

&lt;p&gt;エージェントを顧客データに接続する前に、&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog をダウンロード&lt;/a&gt;して依存 API を検証しておくと安全です。&lt;/p&gt;

&lt;h2&gt;
  
  
  意思決定フレームワーク
&lt;/h2&gt;

&lt;p&gt;次の質問に順に答えると選びやすくなります。&lt;/p&gt;

&lt;h3&gt;
  
  
  Claude マネージドエージェントを選ぶべき場合
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;エージェントが数分から数時間動く&lt;/li&gt;
&lt;li&gt;非同期ジョブが中心&lt;/li&gt;
&lt;li&gt;多数のツール呼び出しがある&lt;/li&gt;
&lt;li&gt;ジョブランナー、サンドボックス、セッションストアを運用したくない&lt;/li&gt;
&lt;li&gt;小規模チームで、運用人数が制約になっている&lt;/li&gt;
&lt;li&gt;ホスト型イベントログを使いたい&lt;/li&gt;
&lt;li&gt;データとコンプライアンス上、Anthropic または AWS 側のサンドボックスを許容できる&lt;/li&gt;
&lt;li&gt;ベータ機能や研究プレビューの制約を受け入れられる&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Claude エージェント SDK を選ぶべき場合
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;エージェントを自社 VPC 内で実行する必要がある&lt;/li&gt;
&lt;li&gt;プライベート DB や内部 API に近い場所で動かしたい&lt;/li&gt;
&lt;li&gt;セッション状態を第三者環境に置けない&lt;/li&gt;
&lt;li&gt;カスタム権限、監査フック、ポリシー制御が必要&lt;/li&gt;
&lt;li&gt;データレジデンシーや規制要件が厳しい&lt;/li&gt;
&lt;li&gt;Bedrock、Vertex、Azure など既存クラウド契約で推論を扱いたい&lt;/li&gt;
&lt;li&gt;ローカルで素早くプロトタイプを作りたい&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  よくある移行パス
&lt;/h3&gt;

&lt;p&gt;実務では、次の流れがよくあります。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;Claude エージェント SDK でローカルプロトタイプを作る&lt;/li&gt;
&lt;li&gt;フック、ツール、MCP 接続、API 契約を検証する&lt;/li&gt;
&lt;li&gt;本番運用コストと制御要件を比較する&lt;/li&gt;
&lt;li&gt;運用削減の価値が大きければマネージドエージェントへ移行する&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;ただし、これは設定変更ではありません。ライブラリ方式から REST + イベント方式に変わり、カスタムツール実行やセッション状態の扱いも変わります。移行はプロジェクトとして計画してください。&lt;/p&gt;

&lt;p&gt;モデルやコーディングエージェントも比較している場合は、&lt;a href="http://apidog.com/blog/claude-vs-codex-comparison-2026?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;2026年版 Claude と Codex の比較&lt;/a&gt;も参考になります。&lt;/p&gt;

&lt;h2&gt;
  
  
  実際のユースケース
&lt;/h2&gt;

&lt;h3&gt;
  
  
  支払返金エージェント
&lt;/h3&gt;

&lt;p&gt;要件:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;サポートチケットを読む&lt;/li&gt;
&lt;li&gt;取引を検索する&lt;/li&gt;
&lt;li&gt;返金ポリシーを確認する&lt;/li&gt;
&lt;li&gt;決済 API を呼び出して返金する&lt;/li&gt;
&lt;li&gt;チケットに結果を書き戻す&lt;/li&gt;
&lt;li&gt;金銭操作の監査証跡を残す&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;このケースでは SDK が有力です。&lt;/p&gt;

&lt;p&gt;理由:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;決済サービスの近く、つまり自社 VPC 内で実行したい&lt;/li&gt;
&lt;li&gt;セッション状態を自社インフラ外に出したくない&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;PreToolUse&lt;/code&gt; フックで「一定額以上の返金には人間承認が必要」というルールを強制できる&lt;/li&gt;
&lt;li&gt;すべての API 呼び出しを監査ログに残せる&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;実装前にやるべきこと:&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;Apidog で決済 API と元帳 API をモックする&lt;/li&gt;
&lt;li&gt;返金、検索、チケット更新の契約テストを作る&lt;/li&gt;
&lt;li&gt;過去1週間分のチケットをモックに対してリプレイする&lt;/li&gt;
&lt;li&gt;エージェントが実際に送るリクエストを確認する&lt;/li&gt;
&lt;li&gt;504 やタイムアウト時の再実行挙動を検証する&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;特に返金処理では、成功済み操作をリトライで再実行するバグが致命的です。API レベルのテストは必須です。&lt;/p&gt;

&lt;h3&gt;
  
  
  非同期サポートチケットトリアージエージェント
&lt;/h3&gt;

&lt;p&gt;要件:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;毎日数千件のサポートチケットを処理する&lt;/li&gt;
&lt;li&gt;チケットを分類する&lt;/li&gt;
&lt;li&gt;関連ログを取得する&lt;/li&gt;
&lt;li&gt;返信案を作る&lt;/li&gt;
&lt;li&gt;解決またはエスカレーションする&lt;/li&gt;
&lt;li&gt;各チケットの処理に数分かかる&lt;/li&gt;
&lt;li&gt;データの機密性は比較的低い&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;このケースではマネージドエージェントが向いています。&lt;/p&gt;

&lt;p&gt;理由:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;長時間実行、非同期、多数のツール呼び出しという形状に合う&lt;/li&gt;
&lt;li&gt;小規模チームがワーカーフリートを運用しなくてよい&lt;/li&gt;
&lt;li&gt;ホスト型イベントログでチケット単位のトレースを取得できる&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;ただし、依存 API の検証は必要です。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;ロギング API をモックする&lt;/li&gt;
&lt;li&gt;チケットシステム MCP サーバーをテストする&lt;/li&gt;
&lt;li&gt;スキーマ変更時に契約テストが落ちるようにする&lt;/li&gt;
&lt;li&gt;エージェントの実トラフィックを観察する&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;ホスティングがマネージドでも、API の正確性は自社の責任です。&lt;/p&gt;

&lt;h3&gt;
  
  
  ファイアウォール内の内部データ運用エージェント
&lt;/h3&gt;

&lt;p&gt;要件:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;「昨日失敗した ETL パーティションをバックフィルする」などの内部依頼を処理する&lt;/li&gt;
&lt;li&gt;内部ジョブ API を呼ぶ&lt;/li&gt;
&lt;li&gt;修復スクリプトを実行する&lt;/li&gt;
&lt;li&gt;ステータスを報告する&lt;/li&gt;
&lt;li&gt;内部 API はパブリックインターネットに出ていない&lt;/li&gt;
&lt;li&gt;データは機密性が高い&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;この場合は SDK が自然な選択です。&lt;/p&gt;

&lt;p&gt;理由:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;エージェントがプライベートサービスに到達できる場所で実行される必要がある&lt;/li&gt;
&lt;li&gt;セッション状態をサードパーティのサンドボックスに置けない&lt;/li&gt;
&lt;li&gt;MCP サーバーを内部ネットワーク内で接続できる&lt;/li&gt;
&lt;li&gt;SDK フックで実行コマンドを既存の監査パイプラインに送れる&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;このケースでは「自社プロセス内で動く」ことが好みではなく要件です。&lt;/p&gt;

&lt;p&gt;AI エージェントが API コンシューマーになっている背景は、&lt;a href="http://apidog.com/blog/ai-agents-new-api-consumers?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;新しい API コンシューマーとしての AI エージェント&lt;/a&gt;でも説明されています。&lt;/p&gt;

&lt;h2&gt;
  
  
  本番前チェックリスト
&lt;/h2&gt;

&lt;p&gt;出荷前に最低限確認すべき項目です。&lt;/p&gt;

&lt;h3&gt;
  
  
  アーキテクチャ
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;[ ] エージェントループをどこで実行するか決めた&lt;/li&gt;
&lt;li&gt;[ ] セッション状態の保存場所を明確にした&lt;/li&gt;
&lt;li&gt;[ ] カスタムツールの実行場所を明確にした&lt;/li&gt;
&lt;li&gt;[ ] MCP サーバーの接続方式を決めた&lt;/li&gt;
&lt;li&gt;[ ] ネットワーク境界とデータレジデンシーを確認した&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  セキュリティ
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;[ ] 危険なツール呼び出しをブロックできる&lt;/li&gt;
&lt;li&gt;[ ] 金銭操作やデータ変更に承認フローがある&lt;/li&gt;
&lt;li&gt;[ ] ツール実行ログを監査できる&lt;/li&gt;
&lt;li&gt;[ ] API キーと認証情報の管理方法を決めた&lt;/li&gt;
&lt;li&gt;[ ] エラー時に機密情報を返さない&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  テスト
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;[ ] すべての依存 API をモックした&lt;/li&gt;
&lt;li&gt;[ ] リクエストとレスポンスの契約テストを作成した&lt;/li&gt;
&lt;li&gt;[ ] MCP サーバーの各ツールを単独でテストした&lt;/li&gt;
&lt;li&gt;[ ] タイムアウトとリトライを検証した&lt;/li&gt;
&lt;li&gt;[ ] 実データに近いトラフィックをリプレイした&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  運用
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;[ ] コストモデルを見積もった&lt;/li&gt;
&lt;li&gt;[ ] イベントログまたはフックログを取得できる&lt;/li&gt;
&lt;li&gt;[ ] 障害時のオンコール責任を決めた&lt;/li&gt;
&lt;li&gt;[ ] ベータ機能への依存を確認した&lt;/li&gt;
&lt;li&gt;[ ] Anthropic の最新料金と利用条件を確認した&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  結論
&lt;/h2&gt;

&lt;p&gt;マネージドエージェントとエージェント SDK の選択は、API 設計に見えますが、実際には運用とデータガバナンスの判断です。&lt;/p&gt;

&lt;p&gt;要点は以下です。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;マネージドエージェントはループとサンドボックスをホストする&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;SDK はループを自社プロセス内で実行する&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;マネージドエージェントは運用負荷を下げるが、ランタイム料金とホスト型状態を受け入れる必要がある&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;SDK は制御性が高いが、インフラと監視を自社で運用する必要がある&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;データレジデンシーが厳しい場合は SDK が有力&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;非同期で長時間動く低機密ワークロードはマネージドエージェントが有力&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;どちらを選んでも、API と MCP サーバーの契約テストは必須&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;SDK でプロトタイプし、必要に応じてマネージドエージェントへ移行するのは現実的。ただし移行はプロジェクトとして扱う&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;次のステップは、エージェントを顧客データや本番 API に接続する前に、依存 API と MCP サーバーをテストすることです。&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog をダウンロード&lt;/a&gt;して、エンドポイントのモック、契約テスト、エージェントの実リクエストデバッグを行い、選択したホスティングモデルを信頼できる依存関係の上に構築してください。&lt;/p&gt;

&lt;h2&gt;
  
  
  よくある質問
&lt;/h2&gt;

&lt;h3&gt;
  
  
  Claude マネージドエージェントと Claude エージェント SDK の主な違いは何ですか？
&lt;/h3&gt;

&lt;p&gt;マネージドエージェントは、Anthropic がエージェントループとセッションごとのサンドボックスを実行するホスト型 REST API です。アプリはイベントを送信し、結果をストリーミングで受け取ります。&lt;/p&gt;

&lt;p&gt;エージェント SDK は、同じようなループを自社プロセスと自社インフラ内で実行する Python または TypeScript ライブラリです。同じ Claude モデルを使えますが、運用責任の境界が違います。&lt;/p&gt;

&lt;h3&gt;
  
  
  Claude エージェント SDK は以前の Claude Code SDK と同じものですか？
&lt;/h3&gt;

&lt;p&gt;はい。Claude Code SDK は、コーディングタスク以外のエージェント用途も含めるため、Claude エージェント SDK に名称変更されました。エージェントループ、組み込みツール、コンテキスト管理は Claude Code を支える仕組みと同じです。&lt;/p&gt;

&lt;h3&gt;
  
  
  どちらが安価ですか？
&lt;/h3&gt;

&lt;p&gt;ワークロード次第です。&lt;/p&gt;

&lt;p&gt;マネージドエージェントは、Claude トークン料金に加えて、アクティブセッション時間のランタイム料金が発生します。SDK には Anthropic の時間単位ランタイム料金はありませんが、自社コンピューティング、監視、スケーリング、オンコール運用のコストが発生します。&lt;/p&gt;

&lt;p&gt;予算化する前に、Anthropic の最新料金ページを確認してください。&lt;/p&gt;

&lt;h3&gt;
  
  
  MCP サーバーは両方で使用できますか？
&lt;/h3&gt;

&lt;p&gt;はい。どちらも Model Context Protocol を介して外部ツールを接続できます。&lt;/p&gt;

&lt;p&gt;そのため、本番エージェントに接続する前に MCP サーバーをテストすることが重要です。&lt;a href="http://apidog.com/blog/mcp-server-testing-apidog?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog を使用した MCP サーバーのテスト&lt;/a&gt;ガイドでは、MCP サーバーが公開する各ツールを直接検証する方法が説明されています。&lt;/p&gt;

&lt;h3&gt;
  
  
  顧客データを Anthropic のインフラストラクチャから外に保持するにはどうすればよいですか？
&lt;/h3&gt;

&lt;p&gt;Claude エージェント SDK を使い、エージェントループを自社環境内で実行します。SDK の場合、ツール実行とセッション状態は自社インフラに残ります。&lt;/p&gt;

&lt;p&gt;マネージドエージェントでは、サンドボックスとイベントログが Anthropic の環境、または条件付きで AWS 側に存在します。厳格なデータレジデンシー要件がある場合は SDK を検討してください。&lt;/p&gt;

&lt;h3&gt;
  
  
  Claude マネージドエージェントは本番環境に対応していますか？
&lt;/h3&gt;

&lt;p&gt;2026年4月にパブリックベータとしてリリースされ、すべてのリクエストで &lt;code&gt;managed-agents-2026-04-01&lt;/code&gt; ベータヘッダーが必要です。&lt;/p&gt;

&lt;p&gt;コアセッション機能は一般に API アカウントで利用可能ですが、成果物やマルチエージェントなど一部機能は研究プレビューとして別途アクセス申請が必要です。本番採用前に最新ドキュメントでステータスを確認してください。&lt;/p&gt;

&lt;h3&gt;
  
  
  エージェントが実際の API にアクセスする前にテストするにはどうすればよいですか？
&lt;/h3&gt;

&lt;p&gt;以下を実施します。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;エージェントが呼び出す API をモックする&lt;/li&gt;
&lt;li&gt;MCP サーバーを単独でテストする&lt;/li&gt;
&lt;li&gt;リクエストとレスポンススキーマの契約テストを作る&lt;/li&gt;
&lt;li&gt;現実的なトラフィックをモックにリプレイする&lt;/li&gt;
&lt;li&gt;エージェントが実際に送るリクエストを観察する&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;Apidog は、API モック、契約テスト、AI エージェントおよび A2A デバッガーを含めてこの流れを支援します。詳細は、&lt;a href="http://apidog.com/blog/how-to-test-ai-agents-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;API を呼び出す AI エージェントのテスト方法&lt;/a&gt;を参照してください。&lt;/p&gt;

&lt;h3&gt;
  
  
  片方から始めて、後でもう片方に切り替えることはできますか？
&lt;/h3&gt;

&lt;p&gt;可能です。一般的には、Claude エージェント SDK でローカルプロトタイプを作り、その後マネージドエージェントへ移行する流れがあります。&lt;/p&gt;

&lt;p&gt;ただし、これは設定変更ではありません。インターフェースはライブラリから REST + イベントに変わり、カスタムツール実行やセッション状態の扱いも変わります。移行プロジェクトとして計画してください。&lt;/p&gt;

</description>
    </item>
    <item>
      <title>Cursor Composer 2.5 対 Opus 4.7 対 GPT-5.5: おすすめコーディングモデル比較</title>
      <dc:creator>Akira</dc:creator>
      <pubDate>Tue, 19 May 2026 02:26:17 +0000</pubDate>
      <link>https://dev.to/aakira/cursor-composer-25-dui-opus-47-dui-gpt-55-osusumekodeingumoderubi-jiao-5f1</link>
      <guid>https://dev.to/aakira/cursor-composer-25-dui-opus-47-dui-gpt-55-osusumekodeingumoderubi-jiao-5f1</guid>
      <description>&lt;p&gt;CursorのComposer 2.5の主張は明確です。Claude Opus 4.7やGPT-5.5に近いコーディング品質を、約10分の1のコストで提供するというものです。この記事では、ベンチマーク、速度、コスト、実運用での選び方に絞って、3つのモデルを実装視点で比較します。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;今すぐApidogを試す&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;モデル自体の概要を先に確認したい場合は、&lt;a href="http://apidog.com/blog/cursor-composer-2-5?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Cursor Composer 2.5ガイド&lt;/a&gt;をご覧ください。ここでは、実際のコードベースと予算を前提に「どのモデルをどの場面で使うべきか」を判断します。&lt;/p&gt;

&lt;h2&gt;
  
  
  簡潔な回答
&lt;/h2&gt;

&lt;p&gt;Composer 2.5は、すべての指標で単独トップのモデルではありません。ただし、実際のソフトウェア開発タスクではOpus 4.7に1〜2ポイント差まで迫りながら、1タスクあたりのコストを1ドル未満に抑えられます。&lt;/p&gt;

&lt;p&gt;日常的にプロダクションコードを出荷するチームでは、次のように使い分けるのが現実的です。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Composer 2.5&lt;/strong&gt;: デフォルトのエージェント作業用&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Opus 4.7&lt;/strong&gt;: 難しい推論や最高品質が必要な例外タスク用&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;GPT-5.5&lt;/strong&gt;: ターミナル中心の自動化や長いコマンドチェーン用&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F05%2Fimage-103.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F05%2Fimage-103.png" alt="比較モデルのベンチマーク結果グラフ" width="800" height="450"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  ベンチマーク比較
&lt;/h2&gt;

&lt;p&gt;Cursorが公開している3つのベンチマークを、Composer 2の旧スコアも含めて整理すると次の通りです。&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;ベンチマーク&lt;/th&gt;
&lt;th&gt;Composer 2.5&lt;/th&gt;
&lt;th&gt;Opus 4.7&lt;/th&gt;
&lt;th&gt;GPT-5.5&lt;/th&gt;
&lt;th&gt;Composer 2&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;SWE-bench Multilingual&lt;/td&gt;
&lt;td&gt;79.8%&lt;/td&gt;
&lt;td&gt;80.5%&lt;/td&gt;
&lt;td&gt;77.8%&lt;/td&gt;
&lt;td&gt;73.7%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Terminal-bench 2.0&lt;/td&gt;
&lt;td&gt;69.3%&lt;/td&gt;
&lt;td&gt;69.4%&lt;/td&gt;
&lt;td&gt;82.7%&lt;/td&gt;
&lt;td&gt;n/a&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;CursorBench v3.1&lt;/td&gt;
&lt;td&gt;63.2%&lt;/td&gt;
&lt;td&gt;64.8%（最大） / 61.6%（デフォルト）&lt;/td&gt;
&lt;td&gt;59.2%（デフォルト）&lt;/td&gt;
&lt;td&gt;n/a&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;読み取るべきポイントは3つです。&lt;/p&gt;

&lt;h3&gt;
  
  
  1. SWE-bench Multilingualではほぼ互角
&lt;/h3&gt;

&lt;p&gt;SWE-bench Multilingualは、複数言語の実際のGitHub Issue修正を評価するベンチマークです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Composer 2.5: 79.8%&lt;/li&gt;
&lt;li&gt;Opus 4.7: 80.5%&lt;/li&gt;
&lt;li&gt;GPT-5.5: 77.8%&lt;/li&gt;
&lt;li&gt;Composer 2: 73.7%&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Composer 2.5はOpus 4.7に1ポイント以内まで迫り、GPT-5.5を上回っています。Composer 2からの伸びも大きく、前世代とは別クラスのモデルと見てよいでしょう。出発点を確認したい場合は、&lt;a href="http://apidog.com/blog/cursor-composer-2?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Composer 2ガイド&lt;/a&gt;を参照してください。&lt;/p&gt;

&lt;h3&gt;
  
  
  2. CursorBenchではデフォルト設定のComposer 2.5が強い
&lt;/h3&gt;

&lt;p&gt;CursorBench v3.1では、デフォルト設定の比較でComposer 2.5が優位です。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Composer 2.5: 63.2%&lt;/li&gt;
&lt;li&gt;Opus 4.7 デフォルト: 61.6%&lt;/li&gt;
&lt;li&gt;GPT-5.5 デフォルト: 59.2%&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Opus 4.7が上回るのは最大設定にした場合のみです。ただし、その場合はコストとレイテンシーも上がります。&lt;/p&gt;

&lt;h3&gt;
  
  
  3. Terminal-benchではGPT-5.5が明確に強い
&lt;/h3&gt;

&lt;p&gt;Terminal-bench 2.0では、GPT-5.5が82.7%で大きくリードしています。&lt;/p&gt;

&lt;p&gt;シェルスクリプト、CLI操作、長いコマンドチェーン、インフラ自動化のようなターミナル中心の作業では、GPT-5.5を候補に入れるべきです。&lt;/p&gt;

&lt;p&gt;ベンチマークの追加確認には、&lt;a href="https://the-decoder.com/cursors-composer-2-5-matches-opus-4-7-and-gpt-5-5-benchmarks-at-a-fraction-of-the-cost/" rel="noopener noreferrer"&gt;The Decoderの記事&lt;/a&gt;と公式の&lt;a href="https://cursor.com/blog/composer-2-5" rel="noopener noreferrer"&gt;Cursor Composer 2.5発表&lt;/a&gt;が参考になります。&lt;/p&gt;

&lt;h2&gt;
  
  
  コスト比較
&lt;/h2&gt;

&lt;p&gt;ベンチマーク差が1〜2ポイントでも、コスト差は大きくなります。&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;モデル&lt;/th&gt;
&lt;th&gt;入力 / Mトークン&lt;/th&gt;
&lt;th&gt;出力 / Mトークン&lt;/th&gt;
&lt;th&gt;1タスクあたりの概算コスト&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;Composer 2.5（標準）&lt;/td&gt;
&lt;td&gt;$0.50&lt;/td&gt;
&lt;td&gt;$2.50&lt;/td&gt;
&lt;td&gt;1ドル未満&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Composer 2.5（高速）&lt;/td&gt;
&lt;td&gt;$3.00&lt;/td&gt;
&lt;td&gt;$15.00&lt;/td&gt;
&lt;td&gt;1桁台の低価格&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Opus 4.7 / GPT-5.5&lt;/td&gt;
&lt;td&gt;フロンティアティア&lt;/td&gt;
&lt;td&gt;フロンティアティア&lt;/td&gt;
&lt;td&gt;数ドル、最大約11ドル&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;Cursorの報告では、Composer 2.5はCursorBenchで約63%のスコアを出しながら、1タスクあたり平均1ドル未満です。一方、Opus 4.7やGPT-5.5は同等またはそれ以下の結果でも、1タスクあたり数ドルかかることがあります。&lt;/p&gt;

&lt;p&gt;月間タスク数で見ると差はさらに明確です。&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;月間エージェントタスク&lt;/th&gt;
&lt;th&gt;1タスクあたりのコスト&lt;/th&gt;
&lt;th&gt;月額概算&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;2,000件&lt;/td&gt;
&lt;td&gt;$1&lt;/td&gt;
&lt;td&gt;$2,000&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;2,000件&lt;/td&gt;
&lt;td&gt;$5&lt;/td&gt;
&lt;td&gt;$10,000&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;2,000件&lt;/td&gt;
&lt;td&gt;$11&lt;/td&gt;
&lt;td&gt;$22,000&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;この規模になると、モデル選定は単なる品質比較ではなく、チームの運用コストに直結します。&lt;/p&gt;

&lt;p&gt;料金の詳細は、&lt;a href="http://apidog.com/blog/cursor-composer-pricing?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Cursor Composer料金ガイド&lt;/a&gt;、&lt;a href="http://apidog.com/blog/gpt-5-5-pricing?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;GPT-5.5の料金に関する投稿&lt;/a&gt;、&lt;a href="http://apidog.com/blog/claude-opus-4-7?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Claude Opus 4.7ガイド&lt;/a&gt;を参照してください。&lt;/p&gt;

&lt;h2&gt;
  
  
  速度とモデルの挙動
&lt;/h2&gt;

&lt;p&gt;品質と価格だけでなく、実際の開発フローでの挙動も重要です。&lt;/p&gt;

&lt;h3&gt;
  
  
  Composer 2.5
&lt;/h3&gt;

&lt;p&gt;Composer 2.5は、Cursor内の長時間実行されるエージェントタスク向けに設計されています。&lt;/p&gt;

&lt;p&gt;向いている作業は次の通りです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;複数ファイルにまたがる修正&lt;/li&gt;
&lt;li&gt;小〜中規模の機能追加&lt;/li&gt;
&lt;li&gt;テスト付きのリファクタリング&lt;/li&gt;
&lt;li&gt;既存コードベースに沿った修正&lt;/li&gt;
&lt;li&gt;日常的なバグ修正&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;高速バリアントは、同じ知能を低レイテンシーで使いたい場合に適しています。&lt;/p&gt;

&lt;h3&gt;
  
  
  Opus 4.7
&lt;/h3&gt;

&lt;p&gt;Opus 4.7は、難しい推論タスクで強いモデルです。特に最大設定では高いスコアを出しますが、その分コストとレイテンシーが上がります。&lt;/p&gt;

&lt;p&gt;向いている作業は次の通りです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;複雑な設計判断&lt;/li&gt;
&lt;li&gt;難度の高いデバッグ&lt;/li&gt;
&lt;li&gt;失敗コストが高い修正&lt;/li&gt;
&lt;li&gt;仕様の曖昧な大規模変更&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  GPT-5.5
&lt;/h3&gt;

&lt;p&gt;GPT-5.5は、ターミナル駆動のワークフローで強みがあります。&lt;/p&gt;

&lt;p&gt;向いている作業は次の通りです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;CLI中心の自動化&lt;/li&gt;
&lt;li&gt;長いコマンドチェーン&lt;/li&gt;
&lt;li&gt;シェルスクリプト作成&lt;/li&gt;
&lt;li&gt;環境構築や検証手順の実行&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Composer 2.5はオープンソースのMoonshot Kimi K2.5チェックポイントをベースに、Cursor向けに大幅に後処理されています。一方、Opus 4.7とGPT-5.5はコードにも強い汎用フロンティアモデルです。この違いは、エディター内エージェントとしての挙動に表れます。&lt;/p&gt;

&lt;h2&gt;
  
  
  どのモデルを選ぶべきか
&lt;/h2&gt;

&lt;p&gt;リーダーボードではなく、運用判断として選ぶのが重要です。&lt;/p&gt;

&lt;h3&gt;
  
  
  Composer 2.5を選ぶべき場合
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;日常的にコードを出荷している&lt;/li&gt;
&lt;li&gt;大量のエージェントタスクを実行する&lt;/li&gt;
&lt;li&gt;1タスクあたりのコストを抑えたい&lt;/li&gt;
&lt;li&gt;Cursor内でマルチファイル修正を多用する&lt;/li&gt;
&lt;li&gt;フロンティア品質に近い結果を低コストで得たい&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Opus 4.7を選ぶべき場合
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;最も難しい推論タスクで最高スコアが必要&lt;/li&gt;
&lt;li&gt;コストより品質上限を優先する&lt;/li&gt;
&lt;li&gt;すでにClaude中心のワークフローを使っている&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Claude中心の運用を検討している場合は、&lt;a href="http://apidog.com/blog/claude-code-vs-cursor-2026?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Claude Code vs Cursorの比較&lt;/a&gt;も参考になります。&lt;/p&gt;

&lt;h3&gt;
  
  
  GPT-5.5を選ぶべき場合
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;ターミナル中心の自動化が多い&lt;/li&gt;
&lt;li&gt;Terminal-benchの強みを活かせる&lt;/li&gt;
&lt;li&gt;コーディングにも使える汎用モデルが欲しい&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;多くのチームでは、次のようなハイブリッド運用が現実的です。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;通常のエージェントタスク → Composer 2.5
難しい設計・推論タスク → Opus 4.7
ターミナル中心の作業 → GPT-5.5
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;他の開発AIツールも含めて比較したい場合は、&lt;a href="http://apidog.com/blog/codex-vs-claude-code-vs-cursor-vs-copilot?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Codex vs Claude Code vs Cursor vs Copilotのまとめ&lt;/a&gt;を参照してください。&lt;/p&gt;

&lt;h2&gt;
  
  
  自分のコードベースで比較する方法
&lt;/h2&gt;

&lt;p&gt;公開ベンチマークは平均値です。自分のコードベースで最適なモデルを判断するには、同じタスクを3モデルで実行して比較します。&lt;/p&gt;

&lt;h3&gt;
  
  
  手順
&lt;/h3&gt;

&lt;ol&gt;
&lt;li&gt;&lt;p&gt;実際にエージェントへ任せたいタスクを1つ選ぶ&lt;br&gt;&lt;br&gt;
例: 再現可能なバグ修正、小さな機能追加、テスト付きリファクタリング&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;Cursorで同じプロンプトを3回実行する&lt;br&gt;&lt;br&gt;
モデルピッカーで次を切り替えます。&lt;br&gt;
&lt;/p&gt;&lt;/li&gt;
&lt;/ol&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;   composer-2.5
   Opus 4.7
   GPT-5.5
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;ol&gt;
&lt;li&gt;各実行を同じ基準で評価する&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;| 評価項目 | 確認内容 |&lt;br&gt;
   |---|---|&lt;br&gt;
   | テスト | 既存テスト・追加テストが通るか |&lt;br&gt;
   | 時間 | 完了までに何分かかったか |&lt;br&gt;
   | コスト | Cursorの利用状況ビューでいくらかかったか |&lt;br&gt;
   | 差分品質 | 既存設計に沿っているか |&lt;br&gt;
   | 修正量 | 人間の手直しがどれくらい必要か |&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;APIを触るタスクでは、生成されたリクエストを&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;で実行する&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;単体テストが通るだけでなく、実際のエンドポイントが期待するレスポンスを返すか確認します。&lt;/p&gt;

&lt;p&gt;この比較を行うと、多くの場合は次の結論になります。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Composer 2.5は品質で十分近い&lt;/li&gt;
&lt;li&gt;コストでは大きく有利&lt;/li&gt;
&lt;li&gt;一部の難しい問題ではフロンティアモデルを使う価値がある&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;重要なのは、リーダーボードではなく自分の作業で判断することです。&lt;/p&gt;
&lt;h2&gt;
  
  
  ベンチマークが見落とす失敗モード
&lt;/h2&gt;

&lt;p&gt;コーディングモデルには、ベンチマークでは見えにくい失敗があります。&lt;/p&gt;

&lt;p&gt;典型例は、実在しないAPIエンドポイントや誤ったスキーマを前提に、自信満々なコードを生成することです。これはComposer 2.5、Opus 4.7、GPT-5.5のどれでも起こり得ます。&lt;/p&gt;

&lt;p&gt;間違っているが見た目はきれいなAPIコードは、コードがない状態よりも危険です。レビューやQAで発見されるまで、誤った前提が残るためです。&lt;/p&gt;

&lt;p&gt;対策はモデルに依存しません。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;モデルに実際のAPI仕様を渡す&lt;/li&gt;
&lt;li&gt;生成されたコードを実際のエンドポイントで検証する&lt;/li&gt;
&lt;li&gt;ステータスコード、ペイロード、認証を確認する&lt;/li&gt;
&lt;li&gt;動作確認済みのリクエストをテストに組み込む&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;Cursorでは、MCPサーバー経由でAPI仕様を渡すことで、モデルが実際のスキーマに基づいてコードを生成しやすくなります。その後、生成されたリクエストを&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;で実行し、チームメイトに渡る前に検証します。&lt;/p&gt;

&lt;p&gt;セットアップ方法は、&lt;a href="http://apidog.com/blog/connect-api-specifications-mcp-cursor?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;CursorでのAPI仕様ウォークスルー&lt;/a&gt;で確認できます。&lt;/p&gt;

&lt;p&gt;モデル選定は速度と請求額を変えます。しかし、検証ループを入れないと、その速度はデバッグ負債に変わります。&lt;/p&gt;
&lt;h2&gt;
  
  
  よくある質問
&lt;/h2&gt;
&lt;h3&gt;
  
  
  Composer 2.5はOpus 4.7より優れていますか？
&lt;/h3&gt;

&lt;p&gt;常に優れているわけではありません。SWE-bench MultilingualではComposer 2.5が79.8%、Opus 4.7が80.5%で、差は1ポイント以内です。CursorBenchのデフォルト設定ではComposer 2.5がわずかに上回ります。&lt;/p&gt;

&lt;p&gt;ただし、Opus 4.7は最大設定でリードします。コストを含めた価値比較では、Composer 2.5が多くのワークロードで有利です。&lt;/p&gt;
&lt;h3&gt;
  
  
  Composer 2.5はGPT-5.5より優れていますか？
&lt;/h3&gt;

&lt;p&gt;SWE-bench MultilingualとCursorBenchではComposer 2.5がGPT-5.5を上回っています。一方、Terminal-bench 2.0ではGPT-5.5が明確に勝っています。&lt;/p&gt;

&lt;p&gt;コード編集中心ならComposer 2.5、ターミナル自動化中心ならGPT-5.5を優先して検討してください。&lt;/p&gt;
&lt;h3&gt;
  
  
  Composer 2.5はなぜ安いのですか？
&lt;/h3&gt;

&lt;p&gt;Composer 2.5はオープンソースのKimi K2.5をベースに構築され、Cursorのエージェントループ向けにチューニングされています。そのため、Cursorがコスト構造を制御しやすくなっています。&lt;/p&gt;

&lt;p&gt;一方、汎用フロンティアモデルはフロンティア価格になりやすいです。&lt;/p&gt;
&lt;h3&gt;
  
  
  Cursorで3つすべてを使えますか？
&lt;/h3&gt;

&lt;p&gt;はい。Cursorのモデルピッカーで、タスクごとにモデルを切り替えられます。これにより、Composer 2.5をデフォルトにしつつ、必要な場面だけOpus 4.7やGPT-5.5を使うハイブリッド戦略が実用的になります。&lt;/p&gt;

&lt;p&gt;セットアップは&lt;a href="http://apidog.com/blog/cursor-composer-2-5?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Cursor Composer 2.5ガイド&lt;/a&gt;を参照してください。&lt;/p&gt;
&lt;h2&gt;
  
  
  結論
&lt;/h2&gt;

&lt;p&gt;ベンチマークの最高値だけを見るなら、Opus 4.7とGPT-5.5にはそれぞれ強い領域があります。しかし、実際の開発タスクにおける「1ドルあたりの品質」で見ると、Composer 2.5は多くのチームにとってデフォルトにしやすいモデルです。&lt;/p&gt;

&lt;p&gt;実運用では、次の構成が扱いやすいでしょう。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;デフォルトのコード修正・機能追加 → Composer 2.5
難しい推論・設計判断 → Opus 4.7
ターミナル中心の自動化 → GPT-5.5
API仕様の検証 → Apidog
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;どのモデルを使う場合でも、実際のAPIコントラクトに基づかせ、生成された出力を検証することが重要です。&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidogをダウンロード&lt;/a&gt;して、生成されたエンドポイントにライブリクエストを送り、動作する呼び出しを自動テストに組み込みましょう。&lt;/p&gt;

</description>
    </item>
    <item>
      <title>Cursor Composer 2.5 でAPIを構築する方法</title>
      <dc:creator>Akira</dc:creator>
      <pubDate>Tue, 19 May 2026 02:25:14 +0000</pubDate>
      <link>https://dev.to/aakira/cursor-composer-25-deapiwogou-zhu-surufang-fa-47d4</link>
      <guid>https://dev.to/aakira/cursor-composer-25-deapiwogou-zhu-surufang-fa-47d4</guid>
      <description>&lt;p&gt;Cursor Composer 2.5は高速かつ低コストなので、APIクライアントやルートハンドラの生成をエージェントに任せやすくなりました。ただし、モデルが実際のAPIコントラクトを知らないままコードを書くと、&lt;code&gt;/v2/orders&lt;/code&gt;のような存在しないエンドポイントや、実サービスとは異なるペイロードを生成することがあります。コードはコンパイルされても、実行時に失敗します。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;今すぐApidogを試す&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;この記事では、Cursor Composer 2.5をMCP経由で実際のAPI仕様に接続し、仕様に基づいてコードを生成し、チームに渡す前に&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;で検証するワークフローを説明します。Composer 2.5自体の概要や利用方法は、&lt;a href="http://apidog.com/blog/cursor-composer-2-5?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Cursor Composer 2.5ガイド&lt;/a&gt;を参照してください。&lt;/p&gt;

&lt;h2&gt;
  
  
  なぜエージェント型モデルはAPIの形状を推測するのか
&lt;/h2&gt;

&lt;p&gt;Composer 2.5は、複数ファイルの編集、テスト実行、修正を含む長いエージェントタスクに向いています。&lt;/p&gt;

&lt;p&gt;たとえば、次のような依頼ができます。&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;請求サービス用のクライアントを追加し、それを決済フローに組み込んでください。&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;Composer 2.5は計画を立て、必要なファイルを編集し、テストが通るまで作業します。これは&lt;a href="http://apidog.com/blog/cursor-composer-2?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Composer 2&lt;/a&gt;からの大きな改善点です。&lt;/p&gt;

&lt;p&gt;ただし、モデルがAPIコントラクトをコンテキストに持っていない場合、空白を「もっともらしい形」で補完します。&lt;/p&gt;

&lt;p&gt;よくある失敗は次の3つです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;エンドポイントが微妙に違う

&lt;ul&gt;
&lt;li&gt;例: モデルは&lt;code&gt;/api/users/{id}&lt;/code&gt;を書くが、実際は&lt;code&gt;/users/{userId}&lt;/code&gt;
&lt;/li&gt;
&lt;/ul&gt;


&lt;/li&gt;

&lt;li&gt;リクエストボディに存在しないフィールドを追加する&lt;/li&gt;

&lt;li&gt;認証方式をサービス固有の方式ではなく、一般的なBearerトークンなどとして扱う&lt;/li&gt;

&lt;/ul&gt;

&lt;p&gt;OpenAPIファイルをそのままチャットに貼ることもできますが、長くなりやすく、コンテキストも消費します。より安定した方法は、モデルにAPI仕様への構造化されたアクセスを与えることです。&lt;/p&gt;

&lt;h2&gt;
  
  
  解決策: MCPを介してComposer 2.5を実際のAPI仕様に接続する
&lt;/h2&gt;

&lt;p&gt;Model Context Protocol、つまりMCPは、AIモデルにツールやデータを提供するためのオープン標準です。&lt;/p&gt;

&lt;p&gt;CursorはMCPサーバーをサポートしています。&lt;a href="http://apidog.com/blog/connect-api-specifications-mcp-cursor?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog MCPサーバー&lt;/a&gt;を使うと、Apidog内のAPI仕様を、Composer 2.5がコーディング中に参照できる構造化データとして公開できます。&lt;/p&gt;

&lt;p&gt;これにより、Composer 2.5は次の情報を推測ではなく仕様から取得できます。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;実際のエンドポイント&lt;/li&gt;
&lt;li&gt;パスパラメーター&lt;/li&gt;
&lt;li&gt;クエリパラメーター&lt;/li&gt;
&lt;li&gt;リクエストスキーマ&lt;/li&gt;
&lt;li&gt;レスポンススキーマ&lt;/li&gt;
&lt;li&gt;エラーレスポンス&lt;/li&gt;
&lt;li&gt;認証要件&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;これは、&lt;a href="http://apidog.com/blog/vibe-coding-with-apidog-mcp-server?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog MCPサーバーでのバイブコーディング&lt;/a&gt;と同じ考え方を、より長い実装タスクに適用する方法です。&lt;/p&gt;

&lt;h2&gt;
  
  
  ステップ1: ApidogでAPI仕様を準備する
&lt;/h2&gt;

&lt;p&gt;まず、モデルが参照する「真実の源」を用意します。&lt;/p&gt;

&lt;p&gt;ApidogでAPIを設計するか、既存の仕様をインポートしてください。ApidogはOpenAPIやPostmanコレクションのインポートに対応しています。&lt;/p&gt;

&lt;p&gt;準備時に確認するポイントは次のとおりです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;エンドポイントが実サービスと一致している&lt;/li&gt;
&lt;li&gt;リクエストボディのスキーマが最新である&lt;/li&gt;
&lt;li&gt;レスポンス例が実際の形式に近い&lt;/li&gt;
&lt;li&gt;エラー時のステータスコードとレスポンスが定義されている&lt;/li&gt;
&lt;li&gt;認証方式が明記されている&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Composer 2.5はこの仕様をもとにコードを書くため、仕様が古いと生成コードも古くなります。最初に仕様を整えることが重要です。&lt;/p&gt;

&lt;h2&gt;
  
  
  ステップ2: Apidog MCPサーバーをCursorに接続する
&lt;/h2&gt;

&lt;p&gt;Cursorは、プロジェクト内の設定ファイルからMCPサーバーを読み取ります。通常は&lt;code&gt;.cursor/mcp.json&lt;/code&gt;を使用します。&lt;/p&gt;

&lt;p&gt;典型的な設定例は次のとおりです。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight json"&gt;&lt;code&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"mcpServers"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"apidog-api-spec"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"command"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"npx"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"args"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="s2"&gt;"-y"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"apidog-mcp-server@latest"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"--project=&amp;lt;your-project-id&amp;gt;"&lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"env"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="nl"&gt;"APIDOG_ACCESS-TOKEN"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"&amp;lt;your-access-token&amp;gt;"&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;code&gt;&amp;lt;your-project-id&amp;gt;&lt;/code&gt;と&lt;code&gt;&amp;lt;your-access-token&amp;gt;&lt;/code&gt;は、自分のApidogプロジェクトに合わせて置き換えてください。&lt;/p&gt;

&lt;p&gt;正確なコマンド、プロジェクトID、トークンの取得方法は、&lt;a href="http://apidog.com/blog/connect-api-specifications-mcp-cursor?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog MCPセットアップウォークスルー&lt;/a&gt;を確認してください。&lt;/p&gt;

&lt;p&gt;設定後は、Cursorを再起動します。再起動しないと、新しいMCPサーバーが認識されないことがあります。&lt;/p&gt;

&lt;h2&gt;
  
  
  ステップ3: Composer 2.5が仕様を読めるか確認する
&lt;/h2&gt;

&lt;p&gt;いきなり実装を依頼する前に、読み取り専用の質問で接続を確認します。&lt;/p&gt;

&lt;p&gt;Cursorでエージェントセッションを開き、モデルピッカーで&lt;code&gt;composer-2.5&lt;/code&gt;を選択します。&lt;/p&gt;

&lt;p&gt;次のように質問します。&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;apidog-api-spec MCPサーバーを使用して、注文リソースのエンドポイントと注文作成に必要なフィールドをリストアップしてください。&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;期待する結果は、Apidogに定義されている実際のエンドポイントとフィールドが返ることです。&lt;/p&gt;

&lt;p&gt;もし一般的なREST APIの例のような回答が返る場合、Composer 2.5は仕様を読めていません。その場合は次を確認します。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;code&gt;.cursor/mcp.json&lt;/code&gt;の場所が正しいか&lt;/li&gt;
&lt;li&gt;MCPサーバー名がプロンプト内の名前と一致しているか&lt;/li&gt;
&lt;li&gt;ApidogのプロジェクトIDが正しいか&lt;/li&gt;
&lt;li&gt;アクセストークンが有効か&lt;/li&gt;
&lt;li&gt;Cursorを再起動したか&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  ステップ4: コントラクトに基づいてコードを生成させる
&lt;/h2&gt;

&lt;p&gt;接続確認ができたら、実装タスクを依頼します。&lt;/p&gt;

&lt;p&gt;重要なのは、仕様ソースを明示することです。&lt;/p&gt;

&lt;p&gt;例:&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;真実の源としてapidog-api-specサーバーを使用して、注文API用の型付きTypeScriptクライアントを記述してください。create-orderおよびget-order呼び出しを含めてください。リクエストおよびレスポンススキーマを正確に一致させ、仕様で定義されている422検証レスポンスのエラー処理も追加してください。&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;より実装寄りにするなら、次のように条件を追加できます。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;apidog-api-specを参照して、注文APIクライアントを実装してください。

要件:
- TypeScriptで実装する
- createOrderとgetOrderを提供する
- リクエスト型とレスポンス型を仕様に合わせる
- 422レスポンスをValidationErrorとして扱う
- 既存のHTTPクライアントラッパーを再利用する
- 生成後に関連テストを実行する
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Composer 2.5は複数ファイルにまたがる作業を維持できるため、次のような構成の実装にも向いています。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;src/
  api/
    orders.ts
  types/
    orders.ts
  hooks/
    useOrder.ts
  tests/
    orders.test.ts
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;プロンプト内でMCPソースを指定しておくことで、モデルが一般知識に戻ってエンドポイントやフィールドを推測するリスクを下げられます。&lt;/p&gt;

&lt;h2&gt;
  
  
  信頼する前に検証する: Apidogテストループ
&lt;/h2&gt;

&lt;p&gt;MCPでモデルを仕様に根拠づけると、誤ったエンドポイントやスキーマの生成は大きく減ります。ただし、検証は不要にはなりません。&lt;/p&gt;

&lt;p&gt;理由は2つあります。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;仕様が実サービスより遅れている可能性がある&lt;/li&gt;
&lt;li&gt;モデルがエッジケースを誤解する可能性がある&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;そのため、生成後はApidogで実際に検証します。&lt;/p&gt;

&lt;h3&gt;
  
  
  1. 生成された呼び出しを実リクエストとして送信する
&lt;/h3&gt;

&lt;p&gt;Composer 2.5が生成したエンドポイント、ヘッダー、ボディを&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;で実行します。&lt;/p&gt;

&lt;p&gt;確認する項目は次のとおりです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;ステータスコードが想定通りか&lt;/li&gt;
&lt;li&gt;レスポンスボディの形が型定義と一致しているか&lt;/li&gt;
&lt;li&gt;認証ヘッダーが正しく送信されているか&lt;/li&gt;
&lt;li&gt;エラー時のレスポンスがコードの分岐と一致しているか&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  2. 動作する呼び出しをテストに変換する
&lt;/h3&gt;

&lt;p&gt;検証済みのリクエストは、Apidog上で自動テストシナリオとして保存します。&lt;/p&gt;

&lt;p&gt;これにより、次回以降の変更でAPIコントラクトが壊れた場合、ユーザーではなくCIやテストで検出できます。&lt;/p&gt;

&lt;h3&gt;
  
  
  3. 未実装のAPIはモック化する
&lt;/h3&gt;

&lt;p&gt;バックエンドがまだ実装していないエンドポイントでも、仕様がApidogにあるならモックを使えます。&lt;/p&gt;

&lt;p&gt;たとえば、Composer 2.5にフロントエンドクライアントを生成させ、Apidogのモックサーバーに対して動作確認できます。&lt;/p&gt;

&lt;p&gt;この流れは、&lt;a href="http://apidog.com/blog/ai-agents-api-testing?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;AIエージェントとAPIテスト&lt;/a&gt;のパターンとも相性が良いです。&lt;/p&gt;

&lt;p&gt;基本方針はシンプルです。&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;モデルはコントラクトに基づいて初稿を書く。人間とテストは、それが実サービスに対して正しく動くことを確認する。&lt;/p&gt;
&lt;/blockquote&gt;

&lt;h2&gt;
  
  
  現実的なエンドツーエンドの例
&lt;/h2&gt;

&lt;p&gt;決済サービスに返金機能を追加する例で考えます。&lt;/p&gt;

&lt;p&gt;前提:&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;返金エンドポイントとスキーマはApidogプロジェクトに定義済み&lt;/li&gt;
&lt;li&gt;Apidog MCPサーバーはCursorに接続済み&lt;/li&gt;
&lt;li&gt;CursorではComposer 2.5を選択済み&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;Composer 2.5には次のように依頼します。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;apidog-api-specを使用して、返金クライアントとそれを呼び出すReactフックを構築してください。

要件:
- 仕様が要求するidempotency-keyヘッダーを含める
- リクエストボディとレスポンス型は仕様に正確に合わせる
- 重複リクエスト時の409エラーを処理する
- 既存のAPIクライアント構成に合わせる
- 実装後に関連テストを実行する
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;期待する作業の流れは次のとおりです。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;Composer 2.5がApidog MCPから返金APIの仕様を読む&lt;/li&gt;
&lt;li&gt;クライアント関数、型、Reactフックを生成する&lt;/li&gt;
&lt;li&gt;既存のプロジェクト構成に合わせてファイルを配置する&lt;/li&gt;
&lt;li&gt;テストを実行し、失敗があれば修正する&lt;/li&gt;
&lt;li&gt;Apidogで実際の返金作成リクエストを送信する&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;idempotency-key&lt;/code&gt;の動作と、重複時の409エラーを確認する&lt;/li&gt;
&lt;li&gt;正常系と重複エラー系をテストシナリオとして保存する&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;このワークフローで避けられる典型的なバグは、べき等ヘッダーの付け忘れです。返金処理では、この種のミスが二重返金のような重大な問題につながります。&lt;/p&gt;

&lt;h2&gt;
  
  
  よくある質問
&lt;/h2&gt;

&lt;h3&gt;
  
  
  Composer 2.5はMCPをサポートしていますか？
&lt;/h3&gt;

&lt;p&gt;はい。Cursorのエージェントツールセットにアクセスでき、MCPサーバーも利用できます。&lt;/p&gt;

&lt;p&gt;モデルピッカーでComposer 2.5を選び、プロジェクトでMCPサーバーを設定してください。モデル選択については、&lt;a href="http://apidog.com/blog/cursor-composer-2-5?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Composer 2.5ガイド&lt;/a&gt;で説明されています。&lt;/p&gt;

&lt;h3&gt;
  
  
  Composer 2.5でMCPを使うにはApidogが必要ですか？
&lt;/h3&gt;

&lt;p&gt;必要なのは、構造化されたAPI仕様ソースです。&lt;/p&gt;

&lt;p&gt;この記事では、仕様、テスト、モックを同じ場所で扱えるため、&lt;a href="http://apidog.com/blog/connect-api-specifications-mcp-cursor?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog MCPサーバー&lt;/a&gt;を使っています。&lt;/p&gt;

&lt;p&gt;他の選択肢は、&lt;a href="http://apidog.com/blog/best-mcp-servers-for-cursor?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Cursor向けの最高のMCPサーバー&lt;/a&gt;のまとめも参考になります。&lt;/p&gt;

&lt;h3&gt;
  
  
  モデルを仕様に根拠づけると、すべての幻覚が止まりますか？
&lt;/h3&gt;

&lt;p&gt;いいえ。&lt;/p&gt;

&lt;p&gt;ただし、モデルが推測ではなく実際のコントラクトを読むため、誤ったエンドポイントやスキーマを生成するリスクは大きく下がります。&lt;/p&gt;

&lt;p&gt;それでもテストは必要です。仕様が実行中のサービスとずれている場合や、モデルがエラー処理を誤解する場合があるためです。&lt;/p&gt;

&lt;h3&gt;
  
  
  小規模プロジェクトでも価値がありますか？
&lt;/h3&gt;

&lt;p&gt;はい。モデルが実際のAPIに触れるなら価値があります。&lt;/p&gt;

&lt;p&gt;設定は基本的に一度だけです。その後は、生成されるAPI呼び出しが「一般的にありそうな形」ではなく、自分のプロジェクトのコントラクトに基づくようになります。&lt;/p&gt;

&lt;h2&gt;
  
  
  結論
&lt;/h2&gt;

&lt;p&gt;Composer 2.5は、APIクライアントや関連実装をエージェントに任せられるほど高速で低コストです。ただし、実運用に近いコードを生成するには、モデルを実際のAPIコントラクトに接続する必要があります。&lt;/p&gt;

&lt;p&gt;Apidog MCPサーバーを使って仕様をCursorに公開し、Composer 2.5が正しいエンドポイント、スキーマ、レスポンスを読めるようにします。そのうえで、&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidogをダウンロード&lt;/a&gt;し、ライブリクエスト、テスト、モックで検証します。&lt;/p&gt;

&lt;p&gt;仕様に基づく生成と実リクエストでの検証を組み合わせることで、エージェントの速度をそのまま出荷可能な実装につなげられます。&lt;/p&gt;

</description>
    </item>
    <item>
      <title>カーソルコンポーザー2.5：機能、使い方、アクセス方法</title>
      <dc:creator>Akira</dc:creator>
      <pubDate>Tue, 19 May 2026 02:24:10 +0000</pubDate>
      <link>https://dev.to/aakira/kasorukonpoza25ji-neng-shi-ifang-akusesufang-fa-1lgm</link>
      <guid>https://dev.to/aakira/kasorukonpoza25ji-neng-shi-ifang-akusesufang-fa-1lgm</guid>
      <description>&lt;p&gt;Cursorは2026年5月18日にComposer 2.5を出荷しました。注目点は明確です。Opus 4.7およびGPT-5.5と実際のソフトウェアベンチマークで匹敵しながら、タスクあたりのコストは1ドル未満に収まるコーディングモデルです。コードを書くことで生計を立てている開発者にとって、この価格対品質比は日々の実装計画に影響します。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;今すぐApidogを試す&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;このガイドでは、開発者が実務で知りたいポイントに絞って説明します。Composer 2.5が何か、Cursor内でどう有効化するか、そして本番コードでどう使うかです。ベンチマーク、価格、実装時の使い分けに加えて、Composer 2.5とApidogを組み合わせ、生成されたAPIコードを実行前提で検証するワークフローも紹介します。&lt;/p&gt;

&lt;h2&gt;
  
  
  Cursor Composer 2.5とは？
&lt;/h2&gt;

&lt;p&gt;Composer 2.5は、Cursor独自のエージェント型コーディングモデルです。Cursorエディタ内で計画を立て、ファイルを編集し、ターミナルコマンドを実行し、自分の作業を検証する用途に最適化されています。&lt;/p&gt;

&lt;p&gt;以前の&lt;a href="http://apidog.com/blog/cursor-composer-2?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Composer 2&lt;/a&gt;は高速な自動補完パートナーに近い存在でした。Composer 2.5では、より長いタスクを文脈を失わずに完了させるエージェントとしての性質が強くなっています。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fscbbfozxelzocyu4xrz2.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fscbbfozxelzocyu4xrz2.png" alt="Cursor Composer 2.5" width="800" height="450"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;主な特徴は次の通りです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;オープンソースの&lt;a href="https://www.moonshot.ai/" rel="noopener noreferrer"&gt;Moonshot Kimi K2.5&lt;/a&gt;チェックポイントを基盤としている&lt;/li&gt;
&lt;li&gt;おおよそ1兆パラメータ規模の基盤を持つ&lt;/li&gt;
&lt;li&gt;Cursorはトレーニング計算予算の約85%を、ベースモデルではなくポストトレーニングと強化学習に使用した&lt;/li&gt;
&lt;li&gt;Composer 2よりも25倍多い合成タスクでトレーニングされた&lt;/li&gt;
&lt;li&gt;Cursorが機能を削除し、モデルがテストに合格するまで再構築するような演習も含まれている&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;実務上の違いは、長いセッションでの安定性です。Composer 2は高速でしたが、複数ステップの作業では意図からずれることがありました。Composer 2.5は、より長いタスクで文脈を保持し、複雑な指示を継続的に実行しやすくなっています。&lt;/p&gt;

&lt;p&gt;モデルファミリーの背景を確認したい場合は、&lt;a href="http://apidog.com/blog/cursor-composer-2?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Composer 2ガイド&lt;/a&gt;で、2.5の前提となるアーキテクチャを確認できます。&lt;/p&gt;

&lt;h3&gt;
  
  
  内部で何が変わったのか
&lt;/h3&gt;

&lt;p&gt;Composer 2.5の改善は、主に3つのトレーニング方針に基づいています。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;テキストフィードバックによるターゲットRL&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
タスクの最後に単一の報酬を与えるだけでなく、Cursorは修正内容を短いヒントとして記述し、そのヒントをローカルコンテキストに入れ、モデルへ蒸留しています。これにより、利用できないツールを呼び出すような挙動を減らしています。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;大規模な合成データ&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
合成タスクが25倍に増えたことで、モデルは実際のリポジトリ作業に近いタスクをより多く経験しています。感覚的なコード生成ではなく、テストで検証される作業を多く学習しています。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;デュアルメッシュHSDPを備えたシャードMuonオプティマイザ&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
これはユーザーが直接操作する機能ではなく、トレーニングインフラです。Cursorが1兆パラメータ規模のモデルを高速な最適化ステップでトレーニングできた理由の一つです。&lt;/p&gt;&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;これらを暗記する必要はありません。重要なのは、Composer 2.5が以前のエージェントよりも長く複雑なタスクで安定しやすい、という点です。&lt;/p&gt;

&lt;h2&gt;
  
  
  Composer 2.5のベンチマーク：実際どのくらい優れているのか？
&lt;/h2&gt;

&lt;p&gt;Cursorは3つのベンチマークでスコアを報告し、Opus 4.7およびGPT-5.5と比較しています。&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;ベンチマーク&lt;/th&gt;
&lt;th&gt;Composer 2.5&lt;/th&gt;
&lt;th&gt;Opus 4.7&lt;/th&gt;
&lt;th&gt;GPT-5.5&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;SWE-bench Multilingual&lt;/td&gt;
&lt;td&gt;79.8%&lt;/td&gt;
&lt;td&gt;80.5%&lt;/td&gt;
&lt;td&gt;77.8%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Terminal-Bench 2.0&lt;/td&gt;
&lt;td&gt;69.3%&lt;/td&gt;
&lt;td&gt;69.4%&lt;/td&gt;
&lt;td&gt;82.7%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;CursorBench v3.1&lt;/td&gt;
&lt;td&gt;63.2%&lt;/td&gt;
&lt;td&gt;64.8%（最大） / 61.6%（デフォルト）&lt;/td&gt;
&lt;td&gt;59.2%（デフォルト）&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;読み方はシンプルです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;a href="https://www.swebench.com/" rel="noopener noreferrer"&gt;SWE-bench&lt;/a&gt; Multilingualでは、Composer 2.5は79.8%&lt;/li&gt;
&lt;li&gt;Opus 4.7との差は1ポイント未満&lt;/li&gt;
&lt;li&gt;GPT-5.5は上回っている&lt;/li&gt;
&lt;li&gt;Composer 2の73.7%から大きく改善している&lt;/li&gt;
&lt;li&gt;CursorBenchでは、Opus 4.7のデフォルト設定をわずかに上回っている&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;一方で、Terminal-Bench 2.0ではGPT-5.5が82.7%で明確にリードしています。長いターミナル操作やCLI中心の作業が多い場合は、この差を考慮する必要があります。&lt;/p&gt;

&lt;p&gt;ただし、最も重要なのはコストです。Cursorは、CursorBenchで約63%のスコアを出しながら、タスクあたりの平均コストが1ドル未満であると報告しています。一方、Opus 4.7やGPT-5.5は、同等またはそれ以下の結果でもタスクあたり数ドルかかります。一部の比較では、競合モデルのコストが最大11ドルに達するとされています。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://the-decoder.com/cursors-composer-2-5-matches-opus-4-7-and-gpt-5-5-benchmarks-at-a-fraction-of-the-cost/" rel="noopener noreferrer"&gt;The Decoder&lt;/a&gt;による独立した報道も、Composer 2.5が最先端に近い品質を低コストで提供しているという同様の結論に達しています。&lt;/p&gt;

&lt;p&gt;つまり、Composer 2.5はすべてのベンチマークで常にトップのモデルではありません。しかし、多くの実務チームにとって重要な「十分に高い品質を、継続利用できるコストで使える」モデルです。&lt;/p&gt;

&lt;h2&gt;
  
  
  Composer 2.5のコストはいくらですか？
&lt;/h2&gt;

&lt;p&gt;Cursorは、Composer 2.5に2つのバリアントを提供しています。&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;バリアント&lt;/th&gt;
&lt;th&gt;入力&lt;/th&gt;
&lt;th&gt;出力&lt;/th&gt;
&lt;th&gt;使う場面&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;スタンダード&lt;/td&gt;
&lt;td&gt;$0.50 / 100万トークン&lt;/td&gt;
&lt;td&gt;$2.50 / 100万トークン&lt;/td&gt;
&lt;td&gt;ほとんどのエージェント作業のデフォルト。費用対効果を重視する場合。&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;高速&lt;/td&gt;
&lt;td&gt;$3.00 / 100万トークン&lt;/td&gt;
&lt;td&gt;$15.00 / 100万トークン&lt;/td&gt;
&lt;td&gt;レイテンシが重要な作業。待ち時間を短くしたい場合。&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;高速バリアントは、同等のモデル品質をより低いレイテンシで提供し、製品上のデフォルトになっています。それでも、他の最先端モデルの高速ティアより安価です。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fu2ncia2kq6islb0yz2jq.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fu2ncia2kq6islb0yz2jq.png" alt="Composer 2.5 pricing" width="800" height="533"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;請求方法はプランによって異なります。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;個人プラン&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Proなどの個人プランには、Composer用の使用量プールがあります。多くのソロ開発者は、日常利用では細かなトークン単価を意識せずに使えます。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;チームおよびエンタープライズプラン&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
APIレートで直接課金されます。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;ローンチプロモーション&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Cursorはリリース後最初の1週間、Composer 2.5の使用量を2倍にしました。早期導入者はテストしやすい期間を得られます。&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Cursorがモデル使用量をどう測定するかは、&lt;a href="http://apidog.com/blog/cursor-composer-pricing?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Cursor Composer価格ガイド&lt;/a&gt;で確認できます。費用を抑えて試したい場合は、&lt;a href="http://apidog.com/blog/cursor-composer-for-free?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Composer無料利用&lt;/a&gt;のチュートリアルも参考になります。&lt;/p&gt;

&lt;h2&gt;
  
  
  Cursor Composer 2.5へのアクセス方法
&lt;/h2&gt;

&lt;p&gt;Composer 2.5は、Cursor内から数ステップで使えます。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Cursorをアップデートする&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Composer 2.5には最近のビルドが必要です。Cursorを開き、アップデートを確認します。macOSではCursorメニュー、その他の環境ではヘルプメニューから確認できます。更新後は再起動します。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;対応プランのアカウントでサインインする&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
ProおよびBusinessプランにはComposer使用量が含まれます。無料アカウントでも含まれる使用量で試せますが、大量に使う場合は有料プランが必要です。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;モデルピッカーを開く&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
チャットまたはエージェントセッションを開始し、モデルのドロップダウンを開きます。&lt;code&gt;composer-2.5&lt;/code&gt;を選択します。通常は高速バリアントがデフォルトで選ばれています。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;エージェントモードを使う&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Composer 2.5はエージェント作業向けです。ファイル編集、ターミナルアクセス、ツール使用を使うには、通常のチャットではなくエージェントモードを使います。&lt;/p&gt;&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;セットアップはこれだけです。モデルは、Cursorが公開するファイル読み取り、編集、ターミナル実行、ツール呼び出しなどのエージェント機能にアクセスできます。最新のデフォルト設定は、公式の&lt;a href="https://cursor.com/docs/models/cursor-composer-2-5" rel="noopener noreferrer"&gt;Composer 2.5モデルドキュメント&lt;/a&gt;で確認できます。&lt;/p&gt;

&lt;p&gt;Cursorを使ったことはあるがエージェント機能を使っていない場合は、&lt;a href="http://apidog.com/blog/cursor-2-0?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Cursor 2.0の概要&lt;/a&gt;を読むと、エージェントインターフェースの基本を把握できます。&lt;/p&gt;

&lt;h2&gt;
  
  
  Composer 2.5を効果的に使う方法
&lt;/h2&gt;

&lt;p&gt;Composer 2.5は、短い補完よりも「完了条件が明確な実装タスク」で力を発揮します。&lt;/p&gt;

&lt;h3&gt;
  
  
  1. 長いタスクを任せる
&lt;/h3&gt;

&lt;p&gt;Composer 2.5の主な改善点は、持続的なパフォーマンスです。1行ずつ指示するのではなく、実装単位で依頼します。&lt;/p&gt;

&lt;p&gt;例：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;注文一覧APIにページネーションを追加してください。
既存のレスポンス形式を壊さず、limitとcursorを受け取れるようにしてください。
関連するユニットテストとAPIテストも更新し、既存テストがすべて通る状態にしてください。
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;このように終了条件を明確にすると、Composer 2.5は複数ファイルを横断して作業しやすくなります。&lt;/p&gt;

&lt;h3&gt;
  
  
  2. 成功条件をプロンプトに書く
&lt;/h3&gt;

&lt;p&gt;Composer 2.5はテスト検証を前提とする作業に向いています。完了条件を曖昧にしないでください。&lt;/p&gt;

&lt;p&gt;例：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;以下を満たすまで修正してください。

- 既存テストはすべてグリーンを維持する
- 新しい注文作成APIは無効な入力に対して422を返す
- 認証されていないリクエストは401を返す
- OpenAPIスキーマと実装のフィールド名が一致する
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;「何をもって完了とするか」を与えることで、モデルが自己修正しやすくなります。&lt;/p&gt;

&lt;h3&gt;
  
  
  3. 標準と高速を使い分ける
&lt;/h3&gt;

&lt;p&gt;品質は同じなので、判断軸はコストとレイテンシです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;標準&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
バッチ的な修正、大きめのリファクタリング、急がない作業&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;高速&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
ライブでやり取りしながら実装する作業、応答待ち時間を減らしたい作業&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;チームで使う場合は、日常の大半を標準に寄せ、ペアプロ的に使う場面だけ高速を選ぶとコストを管理しやすくなります。&lt;/p&gt;

&lt;h3&gt;
  
  
  4. コンテキストを正確に渡す
&lt;/h3&gt;

&lt;p&gt;エージェントモデルは強力ですが、APIの実際の仕様を知らない場合は推測します。推測で生成されたコードは、見た目は正しくても実行時に失敗します。&lt;/p&gt;

&lt;p&gt;特にAPIクライアント、DTO、認証、エラーハンドリング、テストコードでは、実際の仕様を渡してから生成させる方が安全です。&lt;/p&gt;

&lt;h2&gt;
  
  
  Composer 2.5とAPIワークフロー
&lt;/h2&gt;

&lt;p&gt;実際のコーディングタスクの多くはAPIに触れます。たとえばComposer 2.5に「支払いサービスのクライアントを作成して」と依頼すると、見た目の良いコードは生成されます。&lt;/p&gt;

&lt;p&gt;しかし、次のようなズレが起きる可能性があります。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;エンドポイントのパスが実際と違う&lt;/li&gt;
&lt;li&gt;リクエストフィールド名が違う&lt;/li&gt;
&lt;li&gt;認証方式が違う&lt;/li&gt;
&lt;li&gt;エラーレスポンスの形式が違う&lt;/li&gt;
&lt;li&gt;必須フィールドと任意フィールドの扱いが違う&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;この失敗を避けるには、生成と検証を分けて考えます。&lt;/p&gt;

&lt;h3&gt;
  
  
  手順1：実際のAPI仕様をCursorに渡す
&lt;/h3&gt;

&lt;p&gt;モデルに推測させるのではなく、実際のAPI仕様を参照させます。&lt;/p&gt;

&lt;p&gt;&lt;a href="http://apidog.com/blog/connect-api-specifications-mcp-cursor?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog MCPサーバー&lt;/a&gt;を使うと、ApidogのAPI仕様をCursorに接続できます。これにより、Composer 2.5は実際のスキーマに基づいて以下を生成できます。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;リクエストコード&lt;/li&gt;
&lt;li&gt;型定義&lt;/li&gt;
&lt;li&gt;APIクライアント&lt;/li&gt;
&lt;li&gt;テストコード&lt;/li&gt;
&lt;li&gt;エラーハンドリング&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;他のエージェントも併用している場合は、&lt;a href="http://apidog.com/blog/best-mcp-servers-for-cursor?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Cursor向けの最高のMCPサーバー&lt;/a&gt;のまとめも参考になります。&lt;/p&gt;

&lt;h3&gt;
  
  
  手順2：生成されたAPI呼び出しをApidogで検証する
&lt;/h3&gt;

&lt;p&gt;Composer 2.5が書いたエンドポイント呼び出しは、チームメイトのブランチに入る前に検証します。&lt;/p&gt;

&lt;p&gt;実務では次の流れが有効です。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;Composer 2.5でAPIクライアントやテストを生成する&lt;/li&gt;
&lt;li&gt;生成されたリクエストを&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;に入れる&lt;/li&gt;
&lt;li&gt;実際のリクエストを送信する&lt;/li&gt;
&lt;li&gt;ステータスコードを確認する&lt;/li&gt;
&lt;li&gt;レスポンス形状を確認する&lt;/li&gt;
&lt;li&gt;動作する呼び出しを自動テストやモックサーバーに変換する&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;このループにより、エージェントの速度を維持しながら、API仕様とのズレを早期に潰せます。&lt;/p&gt;

&lt;p&gt;ポイントは次の通りです。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;実際の仕様に基づいて生成する
→ 実際のサーバーに対して検証する
→ 検証済みの呼び出しをテストとモックに固定する
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;これにより、速く生成されたコードがデバッグ負債になるのを防げます。&lt;/p&gt;

&lt;h2&gt;
  
  
  Composer 2.5 vs 競合製品
&lt;/h2&gt;

&lt;p&gt;日常のメインツールとして選ぶ場合の比較です。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;vs Opus 4.7&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
SWE-bench MultilingualとCursorBenchではほぼ同等です。タスクあたりのコストはComposer 2.5の方が大幅に安価です。ただし、Opus 4.7はCursorBenchの最大設定では依然として上位です。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;vs GPT-5.5&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Composer 2.5はSWE-bench MultilingualとCursorBenchでGPT-5.5を上回っています。一方、Terminal-Bench 2.0ではGPT-5.5が明確にリードしています。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;vs Claude Code&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
ツールとしての形が異なります。Composer 2.5はCursorエディタ内で動作するエージェントで、Claude Codeはターミナルエージェントです。&lt;a href="http://apidog.com/blog/claude-code-vs-cursor-2026?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Claude Code vs Cursorの比較&lt;/a&gt;では、どちらがどのワークフローに向くかを整理しています。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;vs GitHub Copilot&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Copilotはインライン補完に強いツールです。Composer 2.5は、複数ファイルにまたがるエージェントタスクに向いています。詳細は&lt;a href="http://apidog.com/blog/cursor-ai-vs-github-copilot?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Cursor vs GitHub Copilotガイド&lt;/a&gt;で確認できます。&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Cursorはまた、xAIと協力し、約10倍の計算量を使ってより大きなモデルをトレーニングしているとも述べています。Composer 2.5は到達点ではなく、より急な改善曲線上のチェックポイントと見るべきです。&lt;/p&gt;

&lt;h2&gt;
  
  
  よくある質問
&lt;/h2&gt;

&lt;h3&gt;
  
  
  Composer 2.5は無料ですか？
&lt;/h3&gt;

&lt;p&gt;完全に無料のティアはありません。ただし、個人プランには通常の日常業務をカバーするComposer使用量プールが含まれています。また、Cursorはローンチ週に使用量を2倍にしました。&lt;/p&gt;

&lt;p&gt;含まれる使用量の範囲は、&lt;a href="http://apidog.com/blog/cursor-composer-for-free?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Composer無料利用&lt;/a&gt;ガイドで確認できます。&lt;/p&gt;

&lt;h3&gt;
  
  
  Composer 2.5はComposer 2より優れていますか？
&lt;/h3&gt;

&lt;p&gt;はい。測定可能に改善しています。SWE-bench Multilingualは73.7%から79.8%に上昇し、長いタスクでのコンテキスト保持も改善されています。&lt;/p&gt;

&lt;p&gt;&lt;a href="http://apidog.com/blog/cursor-composer-2?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Composer 2ガイド&lt;/a&gt;は、改善前のベースラインを理解するのに役立ちます。&lt;/p&gt;

&lt;h3&gt;
  
  
  Composer 2.5は何のモデルに基づいていますか？
&lt;/h3&gt;

&lt;p&gt;MoonshotのオープンソースKimi K2.5チェックポイントに基づいて構築されています。その後、Cursorによって強化学習と合成タスクを使った集中的なポストトレーニングが行われています。&lt;/p&gt;

&lt;h3&gt;
  
  
  標準と高速のどちらを選ぶべきですか？
&lt;/h3&gt;

&lt;p&gt;知能は同じです。違いはレイテンシと価格です。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;コスト効率を重視するバッチ作業には標準&lt;/li&gt;
&lt;li&gt;ライブで反復する作業には高速&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;という使い分けが基本です。&lt;/p&gt;

&lt;h3&gt;
  
  
  Composer 2.5はAPI仕様やMCPと連携できますか？
&lt;/h3&gt;

&lt;p&gt;はい。Cursorのエージェントツールセットをサポートしており、MCPも利用できます。&lt;/p&gt;

&lt;p&gt;&lt;a href="http://apidog.com/blog/connect-api-specifications-mcp-cursor?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog MCPサーバー&lt;/a&gt;を通じてAPI仕様を接続すれば、Composer 2.5は実際のスキーマに基づいてコードを生成できます。&lt;/p&gt;

&lt;h2&gt;
  
  
  結論
&lt;/h2&gt;

&lt;p&gt;Composer 2.5は、「最先端品質のコーディング」と「高コスト」が切り離されつつあることを示すモデルです。Cursor内で、Opus 4.7に近い実ソフトウェアタスクの結果を、タスクあたり1ドル未満のコストで狙えます。&lt;/p&gt;

&lt;p&gt;使い始める手順は簡単です。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;Cursorをアップデートする&lt;/li&gt;
&lt;li&gt;モデルドロップダウンで&lt;code&gt;composer-2.5&lt;/code&gt;を選ぶ&lt;/li&gt;
&lt;li&gt;通常チャットではなくエージェントモードを使う&lt;/li&gt;
&lt;li&gt;1行修正ではなく、明確な完了条件を持つマルチステップタスクを渡す&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;さらに、API開発では検証ループを組み合わせることで効果が上がります。実際の仕様に基づいてAPIコードを生成し、&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidogをダウンロード&lt;/a&gt;してライブリクエストを送信し、レスポンスを確認し、動作する呼び出しを自動テストとモックに固定します。&lt;/p&gt;

&lt;p&gt;高速に生成されたコードより、検証済みで高速に生成されたコードの方が価値があります。&lt;/p&gt;

</description>
    </item>
    <item>
      <title>Bitwardenエージェントアクセス：AIコーディングエージェントと安全な資格情報共有方法</title>
      <dc:creator>Akira</dc:creator>
      <pubDate>Fri, 15 May 2026 08:09:06 +0000</pubDate>
      <link>https://dev.to/aakira/bitwardenezientoakusesuaikodeinguezientotoan-quan-nazi-ge-qing-bao-gong-you-fang-fa-2dno</link>
      <guid>https://dev.to/aakira/bitwardenezientoakusesuaikodeinguezientotoan-quan-nazi-ge-qing-bao-gong-you-fang-fa-2dno</guid>
      <description>&lt;p&gt;Claude Code、Codex、Cursor などの AI コーディングエージェントに実 API を触らせると、最初にぶつかるのが資格情報の扱いです。API キーをチャットに貼るとモデルのコンテキストに残り、&lt;code&gt;.env&lt;/code&gt; に置くとエージェントの &lt;code&gt;bash&lt;/code&gt; ツールから読めてしまいます。必要なのは「エージェントを信頼する」ことではなく、エージェントに渡す秘密情報を最小化する仕組みです。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;今すぐ Apidog を試す&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;Bitwarden のオープンソースプロジェクト &lt;a href="https://github.com/bitwarden/agent-access" rel="noopener noreferrer"&gt;Agent Access&lt;/a&gt; は、この問題に対する資格情報共有プロトコル、CLI（&lt;code&gt;aac&lt;/code&gt;）、Rust + Python SDK です。パスワードマネージャーとリモートプロセス（エージェント、CI ランナー、スクリプトなど）の間に暗号化トンネルを作り、必要なドメインまたは保管庫アイテムの資格情報だけを渡します。コンシューマー側が保管庫全体を見ることはありません。&lt;/p&gt;

&lt;p&gt;この記事では、Agent Access のインストール、&lt;code&gt;aac connect&lt;/code&gt;、&lt;code&gt;aac run&lt;/code&gt;、Claude Code / Codex / Cursor での使い方、そして &lt;a href="http://apidog.com/blog/secure-ai-agent-api-credentials?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;AI エージェント API 資格情報を保護する方法&lt;/a&gt; で説明されている資格情報分離パターンとの関係を実装ベースで整理します。&lt;/p&gt;

&lt;h2&gt;
  
  
  Agent Access とは
&lt;/h2&gt;

&lt;p&gt;Agent Access は Bitwarden が構築したオープンプロトコルとリファレンス実装です。CLI の &lt;code&gt;aac&lt;/code&gt; は &lt;a href="https://noiseprotocol.org/" rel="noopener noreferrer"&gt;Noise プロトコル&lt;/a&gt; を使ってエンドツーエンド暗号化されたトンネルを作成します。&lt;/p&gt;

&lt;p&gt;構成は次の通りです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;プロバイダー&lt;/strong&gt;: 保管庫側。接続要求を待ち受け、返す資格情報を決定する&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;コンシューマー&lt;/strong&gt;: エージェント、スクリプト、CI ジョブなど。ドメインまたは保管庫アイテム ID で資格情報を要求する&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;資格情報のスコープ&lt;/strong&gt;: 単一ドメインまたは単一アイテムに限定される&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;監査証跡&lt;/strong&gt;: プロバイダー側とコンシューマー側の両方に残る&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F6felrvem0ts4fxuk62us.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F6felrvem0ts4fxuk62us.png" alt="Agent Access architecture" width="800" height="588"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;現時点では &lt;strong&gt;早期プレビュー&lt;/strong&gt; です。README では「API とプロトコルは変更される可能性があります」と明記されています。また、「機密性の高い資格情報を LLM や AI エージェントに直接入力することは推奨しません」と警告されています。&lt;/p&gt;

&lt;p&gt;実運用で重要になるのは &lt;code&gt;aac run&lt;/code&gt; です。これは秘密情報をエージェントのコンテキストに出さず、子プロセスの環境変数として注入します。&lt;/p&gt;

&lt;h2&gt;
  
  
  なぜ重要なのか
&lt;/h2&gt;

&lt;p&gt;AI コーディングエージェントは、すでにリポジトリの編集だけでなく、テスト実行、API 呼び出し、デプロイまで行います。各ステップには資格情報が必要です。&lt;/p&gt;

&lt;p&gt;しかし、資格情報を雑に扱うと漏洩リスクが高くなります。&lt;a href="http://apidog.com/blog/postman-exposed-api-keys-audit-workspace?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Postman の API キー漏洩事件&lt;/a&gt; が示したように、人間だけでも API キー管理は破綻しがちです。そこにエージェントが加わると、&lt;code&gt;.env&lt;/code&gt;、ログ、シェル履歴、プロンプト履歴が新たな漏洩経路になります。&lt;/p&gt;

&lt;p&gt;Agent Access の基本方針は次の通りです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;資格情報を実行時に取得する&lt;/li&gt;
&lt;li&gt;必要なドメインまたはアイテムだけに限定する&lt;/li&gt;
&lt;li&gt;転送中は暗号化する&lt;/li&gt;
&lt;li&gt;プロセス終了後に秘密情報を残さない&lt;/li&gt;
&lt;li&gt;LLM のコンテキストに秘密情報を入れない&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;既存の &lt;a href="http://apidog.com/blog/api-key-management-tools?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;API キー管理ツール&lt;/a&gt; が一般的な秘密情報管理を扱うのに対し、Agent Access はエージェントとリモートプロセスのユースケースに焦点を当てています。&lt;/p&gt;

&lt;h2&gt;
  
  
  インストール
&lt;/h2&gt;

&lt;p&gt;プラットフォームに合わせて &lt;code&gt;aac&lt;/code&gt; をインストールします。&lt;/p&gt;

&lt;h3&gt;
  
  
  macOS Apple Silicon
&lt;/h3&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;curl &lt;span class="nt"&gt;-L&lt;/span&gt; https://github.com/bitwarden/agent-access/releases/latest/download/aac-macos-aarch64.tar.gz | &lt;span class="nb"&gt;tar &lt;/span&gt;xz
&lt;span class="nb"&gt;sudo mv &lt;/span&gt;aac /usr/local/bin/
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h3&gt;
  
  
  macOS Intel
&lt;/h3&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;curl &lt;span class="nt"&gt;-L&lt;/span&gt; https://github.com/bitwarden/agent-access/releases/latest/download/aac-macos-x86_64.tar.gz | &lt;span class="nb"&gt;tar &lt;/span&gt;xz
&lt;span class="nb"&gt;sudo mv &lt;/span&gt;aac /usr/local/bin/
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h3&gt;
  
  
  Linux x86_64
&lt;/h3&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;curl &lt;span class="nt"&gt;-L&lt;/span&gt; https://github.com/bitwarden/agent-access/releases/latest/download/aac-linux-x86_64.tar.gz | &lt;span class="nb"&gt;tar &lt;/span&gt;xz
&lt;span class="nb"&gt;sudo mv &lt;/span&gt;aac /usr/local/bin/
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h3&gt;
  
  
  Windows x86_64
&lt;/h3&gt;

&lt;p&gt;&lt;a href="https://github.com/bitwarden/agent-access/releases" rel="noopener noreferrer"&gt;最新リリースページ&lt;/a&gt; から &lt;code&gt;aac-windows-x86_64.zip&lt;/code&gt; をダウンロードし、PATH 上のディレクトリに展開します。&lt;/p&gt;

&lt;p&gt;インストール後に確認します。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;aac &lt;span class="nt"&gt;--help&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Bitwarden CLI（&lt;code&gt;bw&lt;/code&gt;）が PATH にある場合、&lt;code&gt;aac&lt;/code&gt; はそれをデフォルトの資格情報プロバイダーとして使います。Bitwarden CLI がない状態で試す場合は、デモプロバイダーとして &lt;code&gt;--provider example&lt;/code&gt; を指定します。&lt;/p&gt;

&lt;h2&gt;
  
  
  クイックスタート: ペアリングして資格情報を取得する
&lt;/h2&gt;

&lt;p&gt;まず、保管庫を持つマシンでリスナーを起動します。通常は開発者のラップトップです。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;aac listen
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;リスナーはペアリングトークンを出力します。&lt;/p&gt;

&lt;p&gt;次に、コンシューマー側で接続します。リモートマシン、CI ランナー、または同じホスト上の別ターミナルで実行できます。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;aac connect &lt;span class="nt"&gt;--token&lt;/span&gt; &amp;lt;pairing-token&amp;gt; &lt;span class="nt"&gt;--domain&lt;/span&gt; github.com &lt;span class="nt"&gt;--output&lt;/span&gt; json
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;レスポンス例です。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight json"&gt;&lt;code&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"credential"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"notes"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="kc"&gt;null&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"password"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"alligator5"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"totp"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="kc"&gt;null&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"uri"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"https://github.com"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"username"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"example"&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"domain"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"github.com"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"success"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="kc"&gt;true&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;ドメインではなく保管庫アイテム ID で取得する場合は、&lt;code&gt;--id&lt;/code&gt; を使います。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;aac connect &lt;span class="nt"&gt;--id&lt;/span&gt; &amp;lt;vault-item-id&amp;gt; &lt;span class="nt"&gt;--output&lt;/span&gt; json
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;code&gt;--id&lt;/code&gt; と &lt;code&gt;--domain&lt;/code&gt; は同時に指定できません。どちらか一方を選びます。&lt;/p&gt;

&lt;p&gt;保管庫アイテムに TOTP が設定されている場合、TOTP コードも同じペイロードで返されます。&lt;/p&gt;

&lt;h2&gt;
  
  
  実運用パターン: &lt;code&gt;aac run&lt;/code&gt; で環境変数を注入する
&lt;/h2&gt;

&lt;p&gt;&lt;code&gt;aac connect&lt;/code&gt; は JSON を返すので、スクリプトからパースして使えます。ただし、AI エージェントや CI でより安全に扱うなら &lt;code&gt;aac run&lt;/code&gt; を使います。&lt;/p&gt;

&lt;p&gt;&lt;code&gt;aac run&lt;/code&gt; は次の処理を行います。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;資格情報を取得する&lt;/li&gt;
&lt;li&gt;指定したフィールドを環境変数として注入する&lt;/li&gt;
&lt;li&gt;子プロセスを実行する&lt;/li&gt;
&lt;li&gt;標準出力、ディスク、親プロセスに秘密情報を出さない&lt;/li&gt;
&lt;/ol&gt;

&lt;h3&gt;
  
  
  特定フィールドだけを注入する
&lt;/h3&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;aac run &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--domain&lt;/span&gt; example.com &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--env&lt;/span&gt; &lt;span class="nv"&gt;DB_PASSWORD&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;password &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--env&lt;/span&gt; &lt;span class="nv"&gt;DB_USER&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;username &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--&lt;/span&gt; psql
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;この例では、保管庫の &lt;code&gt;password&lt;/code&gt; を &lt;code&gt;DB_PASSWORD&lt;/code&gt; に、&lt;code&gt;username&lt;/code&gt; を &lt;code&gt;DB_USER&lt;/code&gt; にマッピングします。&lt;/p&gt;

&lt;h3&gt;
  
  
  すべてのフィールドを注入する
&lt;/h3&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;aac run &lt;span class="nt"&gt;--domain&lt;/span&gt; example.com &lt;span class="nt"&gt;--env-all&lt;/span&gt; &lt;span class="nt"&gt;--&lt;/span&gt; ./deploy.sh
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;code&gt;--env-all&lt;/code&gt; を使うと、利用可能なフィールドが &lt;code&gt;AAC_&lt;/code&gt; プレフィックス付きで注入されます。&lt;/p&gt;

&lt;h3&gt;
  
  
  デフォルト注入と個別上書きを組み合わせる
&lt;/h3&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;aac run &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--domain&lt;/span&gt; example.com &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--env-all&lt;/span&gt; &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--env&lt;/span&gt; &lt;span class="nv"&gt;CUSTOM_PW&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;password &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--&lt;/span&gt; ./deploy.sh
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;利用可能なフィールドは次の通りです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;code&gt;username&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;code&gt;password&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;code&gt;totp&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;code&gt;uri&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;code&gt;notes&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;code&gt;domain&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;code&gt;credential_id&lt;/code&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Bitwarden が AI エージェント向けに推奨しているのは、この &lt;code&gt;aac run&lt;/code&gt; パターンです。&lt;/p&gt;

&lt;p&gt;エージェントには次のようなコマンドだけを見せます。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;aac run &lt;span class="nt"&gt;--domain&lt;/span&gt; api.stripe.com &lt;span class="nt"&gt;--env-all&lt;/span&gt; &lt;span class="nt"&gt;--&lt;/span&gt; ./deploy.sh
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;モデルはパスワードや API キーの値を見ません。秘密情報は &lt;code&gt;deploy.sh&lt;/code&gt; のサブプロセスにだけ渡されます。&lt;/p&gt;

&lt;p&gt;この考え方は、&lt;a href="http://apidog.com/blog/secure-ai-agent-api-credentials?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;AI エージェント API 資格情報を保護する方法&lt;/a&gt; で説明されている分離原則と同じです。&lt;/p&gt;

&lt;h2&gt;
  
  
  Python SDK を使う
&lt;/h2&gt;

&lt;p&gt;CLI ではなくアプリケーションに直接組み込みたい場合は、Python SDK を使えます。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight python"&gt;&lt;code&gt;&lt;span class="kn"&gt;from&lt;/span&gt; &lt;span class="n"&gt;agent_access&lt;/span&gt; &lt;span class="kn"&gt;import&lt;/span&gt; &lt;span class="n"&gt;RemoteClient&lt;/span&gt;

&lt;span class="n"&gt;client&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="nc"&gt;RemoteClient&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;python-remote&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="n"&gt;client&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;connect&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;token&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;ABC-DEF-GHI&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="n"&gt;cred&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;client&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;request_credential&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;example.com&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="nf"&gt;print&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;cred&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;username&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;cred&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;password&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="n"&gt;client&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;close&lt;/span&gt;&lt;span class="p"&gt;()&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Python モジュールは PyO3 をバックエンドに使います。重い処理は Rust 側で実行され、内部では同じ Noise プロトコル実装が使われます。&lt;/p&gt;

&lt;p&gt;ただし、AI エージェントに対しては、資格情報を &lt;code&gt;print()&lt;/code&gt; したりログに出したりしない設計にしてください。SDK を使う場合でも、秘密情報は下流処理に直接渡すのが基本です。&lt;/p&gt;

&lt;h2&gt;
  
  
  Rust SDK を使う
&lt;/h2&gt;

&lt;p&gt;Rust SDK も &lt;code&gt;RemoteClient&lt;/code&gt; インターフェースを提供しています。リファレンス実装はリポジトリの &lt;code&gt;examples/rust-remote/&lt;/code&gt; にあります。&lt;/p&gt;

&lt;p&gt;Rust SDK が向いているケースは次の通りです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;独自 CLI ツールに資格情報取得を組み込む&lt;/li&gt;
&lt;li&gt;ビルドランナーを実装する&lt;/li&gt;
&lt;li&gt;コンパイル済みバイナリとして配布する&lt;/li&gt;
&lt;li&gt;エージェントが呼び出すローカルツールに組み込む&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;既に API ツールを提供しているチームでは、&lt;a href="http://apidog.com/blog/integrate-hashicorp-vault?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;HashiCorp Vault&lt;/a&gt; や &lt;a href="http://apidog.com/blog/integrate-azure-key-vault?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Azure Key Vault&lt;/a&gt; との統合と併用できます。Agent Access はそれらのエンタープライズ保管庫を置き換えるものではなく、開発者ラップトップや CI ランナーでのエージェント利用に向いた補完レイヤーです。&lt;/p&gt;

&lt;h2&gt;
  
  
  Claude Code で使う
&lt;/h2&gt;

&lt;p&gt;Claude Code には、資格情報を直接渡さず、&lt;code&gt;aac run&lt;/code&gt; でラップしたスクリプトを実行させます。&lt;/p&gt;

&lt;p&gt;例として、デプロイスクリプトを用意します。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;&lt;span class="c"&gt;# deploy.sh&lt;/span&gt;
&lt;span class="c"&gt;#!/usr/bin/env bash&lt;/span&gt;

aac run &lt;span class="nt"&gt;--domain&lt;/span&gt; prod.example.com &lt;span class="nt"&gt;--env-all&lt;/span&gt; &lt;span class="nt"&gt;--&lt;/span&gt; ./run-deploy.sh
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;実行権限を付けます。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;&lt;span class="nb"&gt;chmod&lt;/span&gt; +x deploy.sh
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Claude Code には &lt;code&gt;./deploy.sh&lt;/code&gt; を実行させます。プロンプトには API キーを書きません。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;./deploy.sh を実行してステージング環境へデプロイしてください。
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;この場合、Claude Code が見るのはコマンドだけです。秘密情報は &lt;code&gt;run-deploy.sh&lt;/code&gt; の子プロセスにだけ渡されます。&lt;/p&gt;

&lt;p&gt;&lt;a href="http://apidog.com/blog/claude-code-github-actions?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Claude Code GitHub Actions&lt;/a&gt; のような CI 統合でも同じ考え方を使えます。ランナーに &lt;code&gt;aac&lt;/code&gt; をインストールし、保管庫プロバイダーとペアリングして、ジョブ実行時に必要な資格情報だけを取得します。&lt;/p&gt;

&lt;h2&gt;
  
  
  OpenAI Codex で使う
&lt;/h2&gt;

&lt;p&gt;Codex CLI でも同じです。Codex にはスクリプトを呼ばせ、スクリプト内で &lt;code&gt;aac run&lt;/code&gt; を使います。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;&lt;span class="c"&gt;# test-api.sh&lt;/span&gt;
&lt;span class="c"&gt;#!/usr/bin/env bash&lt;/span&gt;

aac run &lt;span class="nt"&gt;--domain&lt;/span&gt; staging.example.com &lt;span class="nt"&gt;--env-all&lt;/span&gt; &lt;span class="nt"&gt;--&lt;/span&gt; npm run &lt;span class="nb"&gt;test&lt;/span&gt;:api
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Codex への指示は、資格情報ではなくタスクに限定します。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;test-api.sh を実行し、失敗した API テストを修正してください。
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Codex のツール呼び出しレイヤーにはコマンドが見えますが、秘密情報の値はモデルのコンテキスト外に残ります。&lt;/p&gt;

&lt;p&gt;&lt;a href="http://apidog.com/blog/openai-codex-from-your-phone?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;スマホからの Codex&lt;/a&gt; のようなワークフローでも、資格情報側はこの分離パターンで扱えます。&lt;/p&gt;

&lt;h2&gt;
  
  
  Cursor で使う
&lt;/h2&gt;

&lt;p&gt;Cursor のターミナルコマンドや Composer ワークフローでも、&lt;code&gt;aac run&lt;/code&gt; でラップしたスクリプトをそのまま使えます。&lt;/p&gt;

&lt;p&gt;ローカル編集が中心の場合、リスナーとコンシューマーは同じマシン上で動かすことが多くなります。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;aac listen
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;別ターミナルまたは Cursor から次を実行します。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;aac run &lt;span class="nt"&gt;--domain&lt;/span&gt; local.example.com &lt;span class="nt"&gt;--env-all&lt;/span&gt; &lt;span class="nt"&gt;--&lt;/span&gt; npm run dev
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Cursor に &lt;code&gt;.env&lt;/code&gt; の中身を読ませるのではなく、必要なコマンドを &lt;code&gt;aac run&lt;/code&gt; 経由に寄せるのがポイントです。&lt;/p&gt;

&lt;h2&gt;
  
  
  OpenClaw で使う
&lt;/h2&gt;

&lt;p&gt;Agent Access は公式の &lt;strong&gt;OpenClaw スキル&lt;/strong&gt; を提供しています。リポジトリには &lt;code&gt;SKILL.md&lt;/code&gt; が含まれています。&lt;/p&gt;

&lt;p&gt;OpenClaw スタイルのスキルを使っているチームでは、スキル側がプロトコル形式を認識し、資格情報を取得して下流ツールへ渡します。&lt;/p&gt;

&lt;p&gt;&lt;a href="http://apidog.com/blog/openclaw-api-keys?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;OpenClaw API キーガイド&lt;/a&gt; では、このエコシステムでの資格情報管理をより広く扱っています。&lt;/p&gt;

&lt;h2&gt;
  
  
  セキュリティモデル
&lt;/h2&gt;

&lt;p&gt;Agent Access のセキュリティ上のポイントは次の 3 つです。&lt;/p&gt;

&lt;h3&gt;
  
  
  1. Noise によるエンドツーエンド暗号化
&lt;/h3&gt;

&lt;p&gt;コンシューマーとプロバイダー間の通信は &lt;a href="https://noiseprotocol.org/" rel="noopener noreferrer"&gt;Noise プロトコルフレームワーク&lt;/a&gt; で暗号化されます。Noise は WireGuard や Signal でも使われるハンドシェイクファミリーです。&lt;/p&gt;

&lt;h3&gt;
  
  
  2. 資格情報はスコープされる
&lt;/h3&gt;

&lt;p&gt;コンシューマーが取得できるのは、要求した単一ドメインまたは単一保管庫アイテム ID の資格情報だけです。保管庫全体を列挙することはできません。&lt;/p&gt;

&lt;h3&gt;
  
  
  3. &lt;code&gt;aac run&lt;/code&gt; は秘密情報をディスクに書かない
&lt;/h3&gt;

&lt;p&gt;&lt;code&gt;aac run&lt;/code&gt; は秘密情報を環境変数として子プロセスに渡します。ファイルに書き込まず、標準出力に出さず、シェル履歴にも残しません。&lt;/p&gt;

&lt;h2&gt;
  
  
  Agent Access が防がないもの
&lt;/h2&gt;

&lt;p&gt;Agent Access は万能ではありません。次のリスクは残ります。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;侵害されたコンシューマープロセス&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
エージェントまたは子プロセスが悪意ある動作をすれば、スコープされた資格情報も漏洩し得ます。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;侵害されたプロバイダー&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Bitwarden 保管庫自体が侵害されていれば、このレイヤーでは守れません。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;LLM への直接貼り付け&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
API キーをチャットやプロンプトに貼った時点で、Agent Access の外側に漏れます。README でも、機密資格情報を LLM や AI エージェントに直接入力しないよう明記されています。&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  実装パターン: エージェントが API を変更し、Apidog が契約を検証する
&lt;/h2&gt;

&lt;p&gt;AI エージェントを API 開発に入れる場合、実用的なループは次の形です。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;エージェントがコードを変更する&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Claude Code、Codex、Cursor がエンドポイント変更の PR を作る。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;CI がテストを実行する&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
テストランナーが &lt;code&gt;aac run&lt;/code&gt; で API キーを取得し、ステージング環境に対してテストを実行する。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Apidog が契約を検証する&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt; で OpenAPI 契約テストを別 CI ステップとして実行する。このステップも &lt;code&gt;aac run&lt;/code&gt; 経由にする。&lt;/p&gt;&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;例です。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;aac run &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--domain&lt;/span&gt; staging-api.example.com &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--env&lt;/span&gt; &lt;span class="nv"&gt;API_TOKEN&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;password &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--&lt;/span&gt; npm run &lt;span class="nb"&gt;test&lt;/span&gt;:contract
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;この構成では、エージェントはコードを変更できますが、API キーの値は見ません。契約テストは Apidog 側で実行され、秘密情報は保管庫から必要なプロセスにだけ渡されます。&lt;/p&gt;

&lt;p&gt;AI 駆動の API 変更をテストする全体像は、&lt;a href="http://apidog.com/blog/how-to-test-ai-agents-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;API を呼び出す AI エージェントをテストする方法&lt;/a&gt; でも整理されています。&lt;/p&gt;

&lt;h2&gt;
  
  
  制限事項
&lt;/h2&gt;

&lt;p&gt;現時点で注意すべき点です。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;早期プレビュー&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
API とプロトコルは変更される可能性があります。本番ワークフローに固定する場合は、将来の追従コストを見込んでください。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;デフォルトでは Bitwarden CLI が必要&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
デフォルトのプロバイダーは &lt;code&gt;bw&lt;/code&gt; です。&lt;a href="https://bitwarden.com/help/cli/" rel="noopener noreferrer"&gt;Bitwarden CLI&lt;/a&gt; をインストールするか、検証時は &lt;code&gt;--provider example&lt;/code&gt; を使います。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;設定ファイルはまだない&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
現状はフラグ駆動です。繰り返し使うコマンドはスクリプト化するのが現実的です。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;LLM プロンプトに秘密情報を貼らない&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Agent Access を入れていても、資格情報をチャットに貼れば保護できません。&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  FAQ
&lt;/h2&gt;

&lt;h3&gt;
  
  
  Agent Access は無料ですか？
&lt;/h3&gt;

&lt;p&gt;はい。CLI、SDK、プロトコルは Bitwarden の GitHub 組織でオープンソースとして公開されています。ただし、保管庫として Bitwarden を使う場合は、Bitwarden の利用条件や料金が適用されます。&lt;/p&gt;

&lt;h3&gt;
  
  
  Bitwarden 以外でも使えますか？
&lt;/h3&gt;

&lt;p&gt;プロトコルはベンダーニュートラルに設計されています。リファレンス実装には Bitwarden サポートとサンプルプロバイダーが含まれています。他のベンダーが独自プロバイダーを提供する余地があります。&lt;/p&gt;

&lt;h3&gt;
  
  
  パスワードマネージャーなしで試せますか？
&lt;/h3&gt;

&lt;p&gt;検証目的なら可能です。デモプロバイダーを使います。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;aac connect &lt;span class="nt"&gt;--provider&lt;/span&gt; example &lt;span class="nt"&gt;--domain&lt;/span&gt; test.com &lt;span class="nt"&gt;--output&lt;/span&gt; json
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;本番利用では実際のプロバイダーが必要です。&lt;/p&gt;

&lt;h3&gt;
  
  
  コンシューマープロセスにネットワークアクセスは必要ですか？
&lt;/h3&gt;

&lt;p&gt;はい。コンシューマーはプロバイダーのリスナーに到達できる必要があります。リスナーとコンシューマーが同じホストにある場合は、ローカルだけでも構成できます。&lt;/p&gt;

&lt;h3&gt;
  
  
  &lt;code&gt;.env&lt;/code&gt; と何が違いますか？
&lt;/h3&gt;

&lt;p&gt;&lt;code&gt;.env&lt;/code&gt; はディスク上に存在します。誤ってリポジトリにコミットされる可能性があり、エージェントがシェルを実行できるなら読み取れます。&lt;/p&gt;

&lt;p&gt;&lt;code&gt;aac run&lt;/code&gt; は秘密情報をプロセスメモリ上に限定し、子プロセスにスコープします。プロセス終了後は残りません。&lt;/p&gt;

&lt;h3&gt;
  
  
  HashiCorp Vault や AWS Secrets Manager の代替ですか？
&lt;/h3&gt;

&lt;p&gt;いいえ。大規模なサービス間秘密情報管理では、HashiCorp Vault や AWS Secrets Manager のようなエンタープライズ向け保管庫が引き続き適しています。&lt;/p&gt;

&lt;p&gt;Agent Access は、開発者ラップトップ、AI エージェント、CI ランナーのようなギャップを埋めるための仕組みです。&lt;/p&gt;

&lt;h3&gt;
  
  
  Anthropic や OpenAI は直接統合していますか？
&lt;/h3&gt;

&lt;p&gt;現時点で発表されていません。現在の統合モデルは、エージェントが呼ぶスクリプトを &lt;code&gt;aac run&lt;/code&gt; でラップする形です。&lt;/p&gt;

&lt;h3&gt;
  
  
  バグ報告や貢献はどこで行いますか？
&lt;/h3&gt;

&lt;p&gt;&lt;a href="https://github.com/bitwarden/agent-access" rel="noopener noreferrer"&gt;GitHub リポジトリ&lt;/a&gt; で issue、pull request、プロトコル議論を行えます。&lt;/p&gt;

&lt;h2&gt;
  
  
  まず試す手順
&lt;/h2&gt;

&lt;p&gt;最小構成で試すなら、次の順番です。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;code&gt;aac&lt;/code&gt; をインストールする&lt;/li&gt;
&lt;li&gt;ラップトップでリスナーを起動する
&lt;/li&gt;
&lt;/ol&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;aac listen
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;ol&gt;
&lt;li&gt;別ターミナルでデモプロバイダーを使って接続する
&lt;/li&gt;
&lt;/ol&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;aac connect &lt;span class="nt"&gt;--provider&lt;/span&gt; example &lt;span class="nt"&gt;--domain&lt;/span&gt; test.com &lt;span class="nt"&gt;--output&lt;/span&gt; json
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;ol&gt;
&lt;li&gt;JSON が返ることを確認する&lt;/li&gt;
&lt;li&gt;デモプロバイダーを &lt;code&gt;bw&lt;/code&gt; に置き換える&lt;/li&gt;
&lt;li&gt;実際のスクリプトを &lt;code&gt;aac run&lt;/code&gt; でラップする&lt;/li&gt;
&lt;li&gt;API キーを AI エージェントに貼り付ける運用をやめる&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;API テスト側では、Agent Access と &lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt; を組み合わせると責務を分離できます。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;保管庫が秘密情報を保持する&lt;/li&gt;
&lt;li&gt;Agent Access が実行時に必要最小限の資格情報を渡す&lt;/li&gt;
&lt;li&gt;Apidog が API 契約を検証する&lt;/li&gt;
&lt;li&gt;AI エージェントはコード変更に集中する&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;この形にすると、エージェントを開発ワークフローに入れつつ、資格情報をプロンプト、&lt;code&gt;.env&lt;/code&gt;、ログ、シェル履歴から切り離せます。&lt;/p&gt;

</description>
    </item>
    <item>
      <title>2026年版：G2が選ぶAPI管理ツールおすすめ7選</title>
      <dc:creator>Akira</dc:creator>
      <pubDate>Fri, 15 May 2026 07:37:46 +0000</pubDate>
      <link>https://dev.to/aakira/2026nian-ban-g2gaxuan-buapiguan-li-turuosusume7xuan-53kb</link>
      <guid>https://dev.to/aakira/2026nian-ban-g2gaxuan-buapiguan-li-turuosusume7xuan-53kb</guid>
      <description>&lt;p&gt;G2 Spring 2026 API管理グリッドが発表されました。対象は、2つのリーダー（Apidog、viaSocket）、3つのハイパフォーマー（Traefik Labs、Rasayel、Backendless）、2つのニッチプレイヤー（Moesif/WSO2、Thunder Client）です。同じ「API管理」カテゴリでも、実際に解決する問題は大きく異なります。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;今すぐApidogを試す&lt;/a&gt;
&lt;/p&gt;

&lt;h2&gt;
  
  
  要約
&lt;/h2&gt;

&lt;p&gt;&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;とviaSocketがG2のSpring 2026 API管理グリッドをリードしています。&lt;/p&gt;

&lt;p&gt;実装観点で見ると、選び方は次のようになります。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;APIの設計、テスト、モック、ドキュメントを1つのワークスペースで管理したい → Apidog&lt;/li&gt;
&lt;li&gt;SaaS間の処理をWebフックやAPIで自動化したい → viaSocket&lt;/li&gt;
&lt;li&gt;Kubernetes前提でAPIゲートウェイを運用したい → Traefik Labs&lt;/li&gt;
&lt;li&gt;WhatsApp Business APIを業務に組み込みたい → Rasayel&lt;/li&gt;
&lt;li&gt;バックエンドを自前で構築せずAPIを自動生成したい → Backendless&lt;/li&gt;
&lt;li&gt;公開APIの利用状況、課金、分析を見たい → Moesif&lt;/li&gt;
&lt;li&gt;VS Code内で軽量にREST APIを叩きたい → Thunder Client&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;重要なのは、G2のクアドラント順位だけでなく、自分のチームにとって「API管理」が何を意味するかです。&lt;/p&gt;

&lt;h2&gt;
  
  
  G2のSpring 2026グリッドが示すもの
&lt;/h2&gt;

&lt;p&gt;G2の&lt;a href="https://company.g2.com/news/g2-spring-2026-reports" rel="noopener noreferrer"&gt;Spring 2026レポート&lt;/a&gt;は、2026年3月17日に27,019件公開され、四半期で1.72%増加しました。G2のマーケティング担当副社長Palmer Houchinsによると、すべてのカテゴリでリーダーバッジを獲得する製品はG2全体のわずか3%です。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F47547nvmgeb21mnxxsli.jpg" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F47547nvmgeb21mnxxsli.jpg" alt="G2 Spring 2026 API Management Grid" width="800" height="525"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;G2グリッドは、次の2軸で製品を評価します。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;顧客満足度：レビューに基づく評価&lt;/li&gt;
&lt;li&gt;市場での存在感：規模、リーチ、レビュー数など&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Spring 2026の&lt;a href="https://www.g2.com/categories/api-management" rel="noopener noreferrer"&gt;API管理カテゴリ&lt;/a&gt;では、ApidogとviaSocketがリーダーに分類されています。Traefik Labs、Rasayel、Backendlessはハイパフォーマー、Moesif（現在はWSO2傘下）とThunder Clientはニッチプレイヤーです。&lt;/p&gt;

&lt;p&gt;ただし、クアドラントよりも適合性が重要です。ニッチツールでも、解決したい問題に合っていれば最適です。逆にリーダー製品でも、チームの課題と合わなければ過剰です。&lt;/p&gt;

&lt;p&gt;まずは、&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidogをダウンロード&lt;/a&gt;して、自分のAPIワークフローに合うか確認できます。&lt;/p&gt;

&lt;h2&gt;
  
  
  7つのツールを一覧で見る
&lt;/h2&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;ツール&lt;/th&gt;
&lt;th&gt;G2クアドラント&lt;/th&gt;
&lt;th&gt;最適な用途&lt;/th&gt;
&lt;th&gt;オープンソース？&lt;/th&gt;
&lt;th&gt;価格モデル&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;Apidog&lt;/td&gt;
&lt;td&gt;リーダー&lt;/td&gt;
&lt;td&gt;オールインワンのAPIデザイン、テスト、モック、ドキュメント&lt;/td&gt;
&lt;td&gt;無料枠 + 有料&lt;/td&gt;
&lt;td&gt;ユーザーごとのSaaS&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;viaSocket&lt;/td&gt;
&lt;td&gt;リーダー&lt;/td&gt;
&lt;td&gt;APIフックによるノーコードのワークフロー自動化&lt;/td&gt;
&lt;td&gt;いいえ&lt;/td&gt;
&lt;td&gt;月額50ドルのエントリープラン&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Traefik Labs&lt;/td&gt;
&lt;td&gt;ハイパフォーマー&lt;/td&gt;
&lt;td&gt;クラウドネイティブAPIゲートウェイ + GitOpsガバナンス&lt;/td&gt;
&lt;td&gt;はい（Proxy OSS）&lt;/td&gt;
&lt;td&gt;無料OSS、有料Hub&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Rasayel&lt;/td&gt;
&lt;td&gt;ハイパフォーマー&lt;/td&gt;
&lt;td&gt;WhatsApp Businessメッセージング + REST API&lt;/td&gt;
&lt;td&gt;いいえ&lt;/td&gt;
&lt;td&gt;シートごとのSaaS&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Backendless&lt;/td&gt;
&lt;td&gt;ハイパフォーマー&lt;/td&gt;
&lt;td&gt;自動生成RESTおよびGraphQLを備えたBaaS&lt;/td&gt;
&lt;td&gt;いいえ&lt;/td&gt;
&lt;td&gt;無料枠 + 有料&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Moesif（WSO2）&lt;/td&gt;
&lt;td&gt;ニッチ&lt;/td&gt;
&lt;td&gt;API分析、可観測性、収益化&lt;/td&gt;
&lt;td&gt;いいえ&lt;/td&gt;
&lt;td&gt;使用量ベース&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Thunder Client&lt;/td&gt;
&lt;td&gt;ニッチ&lt;/td&gt;
&lt;td&gt;VS Code RESTクライアント（シングルユーザーテスト）&lt;/td&gt;
&lt;td&gt;いいえ&lt;/td&gt;
&lt;td&gt;無料 + プロ有料&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;G2のカテゴリには、ライフサイクルプラットフォーム、iPaaS自動化、ゲートウェイ、分析、IDE拡張機能が同じグリッドに含まれています。そのため、実装したいワークフローを基準に比較する必要があります。&lt;/p&gt;

&lt;h2&gt;
  
  
  Apidog：エンドツーエンドのAPIワークフローのリーダー
&lt;/h2&gt;

&lt;p&gt;Apidogは、APIの設計、テスト、モック、ドキュメントを1つのワークスペースにまとめる製品です。複数ツールをつなぎ込む代わりに、API仕様を中心にチーム全体の作業を同期できます。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F117hjvap1ojetzsbvucs.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F117hjvap1ojetzsbvucs.png" alt="Apidog API platform" width="800" height="530"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Apidogで実行できる主な作業は次のとおりです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;API設計&lt;/strong&gt;：OpenAPI 3.0/3.1ベースのスキーマファースト設計&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;テスト&lt;/strong&gt;：ビジュアルテストビルダー、CI/CD連携、スクリプト不要のケース作成&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;モック&lt;/strong&gt;：スキーマから動的レスポンスを生成&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;ドキュメント&lt;/strong&gt;：公開URLまたは非公開URLでAPIドキュメントを生成&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;コラボレーション&lt;/strong&gt;：リアルタイム同期、バージョン管理、ロールベースアクセス&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;実装フローは次のように組めます。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;OpenAPI仕様を作成またはPostmanコレクションからインポートする&lt;/li&gt;
&lt;li&gt;エンドポイント、リクエスト、レスポンススキーマを定義する&lt;/li&gt;
&lt;li&gt;フロントエンド向けにモックサーバーを公開する&lt;/li&gt;
&lt;li&gt;QAが同じ仕様からテストケースを作成する&lt;/li&gt;
&lt;li&gt;ドキュメントを自動生成してチームや外部開発者に共有する&lt;/li&gt;
&lt;li&gt;CI/CDでAPIテストを実行する&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;Apidogが特に向いているのは、API仕様を単一の信頼できる情報源として管理したい100人以下のエンジニアリングチームです。バックエンド、フロントエンド、QAが同じワークスペースで作業できるため、仕様のズレを減らせます。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidogをダウンロード&lt;/a&gt;すれば、Postmanコレクションをインポートしてすぐに試せます。クレジットカードは不要で、無料枠から開始できます。&lt;/p&gt;

&lt;h2&gt;
  
  
  viaSocket：ノーコード統合チームのリーダー
&lt;/h2&gt;

&lt;p&gt;viaSocketは、従来のAPIゲートウェイというより、ZapierやMakeに近い&lt;a href="https://viasocket.com" rel="noopener noreferrer"&gt;AIワークフロー自動化プラットフォーム&lt;/a&gt;です。Webフック、条件分岐、カスタムJavaScriptを使ってSaaSアプリケーションを接続できます。&lt;/p&gt;

&lt;p&gt;向いているユースケースは次のとおりです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;フォーム送信をCRMに登録する&lt;/li&gt;
&lt;li&gt;決済イベントをSlackやメールに通知する&lt;/li&gt;
&lt;li&gt;複数SaaS間で顧客データを同期する&lt;/li&gt;
&lt;li&gt;Webフックをトリガーに業務フローを実行する&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;強みは、統合カタログ、カスタムAPIコール、Webフック対応、非開発者でも扱いやすいセットアップです。&lt;/p&gt;

&lt;p&gt;一方で、以下の用途には向きません。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;APIゲートウェイ&lt;/li&gt;
&lt;li&gt;レート制限&lt;/li&gt;
&lt;li&gt;OAuthフロー管理&lt;/li&gt;
&lt;li&gt;契約テスト&lt;/li&gt;
&lt;li&gt;内部マイクロサービスの管理&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;運用、マーケティング、営業、収益チームがSaaSツールを連携させるならviaSocketが適しています。公開APIを開発・出荷するエンジニアリングチームは、別の製品を検討すべきです。&lt;/p&gt;

&lt;h2&gt;
  
  
  Traefik Labs：API管理を搭載したオープンソースゲートウェイ
&lt;/h2&gt;

&lt;p&gt;Traefik Proxyは、クラウドネイティブ環境で使われるオープンソースのアプリケーションプロキシです。&lt;a href="https://traefik.io/traefik-hub" rel="noopener noreferrer"&gt;Traefik Hub&lt;/a&gt;は、その上に開発者ポータル、ライフサイクル制御、GitOpsガバナンスなどを追加する商用レイヤーです。&lt;/p&gt;

&lt;p&gt;向いている構成は次のようなものです。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;Client
  ↓
Traefik Proxy / Traefik Hub
  ↓
Kubernetes Services
  ↓
Backend APIs
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Traefik Labsの強みは次のとおりです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Kubernetes Ingressとの相性がよい&lt;/li&gt;
&lt;li&gt;サービスディスカバリーに対応&lt;/li&gt;
&lt;li&gt;動的設定が可能&lt;/li&gt;
&lt;li&gt;Let’s Encryptによる証明書管理を自動化できる&lt;/li&gt;
&lt;li&gt;GitでAPI、ルート、ポリシーを管理できる&lt;/li&gt;
&lt;li&gt;Traefik HubでAPI管理機能を追加できる&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;注意点は、API設計やテストのツールではないことです。KubernetesやゲートウェイレイヤーはTraefik、API設計とテストは&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;のような上流ツールで分担する構成が現実的です。&lt;/p&gt;

&lt;p&gt;関連情報は、&lt;a href="http://apidog.com/blog/open-source-api-management-tools?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;オープンソースAPI管理ツール&lt;/a&gt;のまとめと&lt;a href="http://apidog.com/blog/top-api-management-tools-for-enterprise?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;エンタープライズチーム向けのトップAPI管理プラットフォーム&lt;/a&gt;も参考になります。&lt;/p&gt;

&lt;h2&gt;
  
  
  Rasayel：WhatsApp Business API向けプラットフォーム
&lt;/h2&gt;

&lt;p&gt;Rasayelは、チーム受信箱、チャットボット、一括メッセージングを備えたWhatsApp Businessプラットフォームです。G2のAPI管理カテゴリに含まれている理由は、&lt;a href="https://rest.developers.rasayel.io" rel="noopener noreferrer"&gt;RESTおよびGraphQL API&lt;/a&gt;とAPIキー管理UIを提供しているためです。&lt;/p&gt;

&lt;p&gt;選ぶべきケースは明確です。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;顧客サポートや営業をWhatsAppで運用している&lt;/li&gt;
&lt;li&gt;WhatsAppメッセージをプログラムから送受信したい&lt;/li&gt;
&lt;li&gt;HubSpotやPipedriveとWhatsAppを接続したい&lt;/li&gt;
&lt;li&gt;Twilioを直接扱わず、Webフック経由で連携したい&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;一方で、次の用途には向きません。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;内部マイクロサービスAPIの管理&lt;/li&gt;
&lt;li&gt;エッジゲートウェイ&lt;/li&gt;
&lt;li&gt;汎用APIライフサイクル管理&lt;/li&gt;
&lt;li&gt;WhatsAppを使わないプロダクト&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Rasayelは汎用API管理ツールではなく、WhatsApp Business APIの業務利用に特化した製品です。&lt;/p&gt;

&lt;h2&gt;
  
  
  Backendless：自動生成APIを備えたBaaS
&lt;/h2&gt;

&lt;p&gt;&lt;a href="https://backendless.com/feature/service-management/" rel="noopener noreferrer"&gt;Backendless&lt;/a&gt;は、データモデルからRESTおよびGraphQLエンドポイントを自動生成するBackend-as-a-Serviceです。テーブルを定義するとAPIが生成され、サービスを定義するとメソッド単位で呼び出しを追跡できます。&lt;/p&gt;

&lt;p&gt;典型的な使い方は次のとおりです。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;データモデルを定義する&lt;/li&gt;
&lt;li&gt;RESTまたはGraphQL APIを自動生成する&lt;/li&gt;
&lt;li&gt;Android、iOS、JavaScript、.NET SDKから呼び出す&lt;/li&gt;
&lt;li&gt;メソッド単位で権限を設定する&lt;/li&gt;
&lt;li&gt;API呼び出しをサービスレベルで追跡する&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;Backendlessが向いているのは、バックエンドを自前で構築したくないスタートアップや小規模チームです。&lt;/p&gt;

&lt;p&gt;向いていないのは次のケースです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;既存バックエンドの前段にAPI管理レイヤーを置きたい&lt;/li&gt;
&lt;li&gt;契約ファーストでAPIを設計したい&lt;/li&gt;
&lt;li&gt;ベンダーロックインを避けたい&lt;/li&gt;
&lt;li&gt;オンプレミスで自由に展開したい&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;「サービスがすでにあり、ゲートウェイが必要」という課題なら、BackendlessではなくTraefikなどのゲートウェイ製品を検討すべきです。&lt;/p&gt;

&lt;h2&gt;
  
  
  Moesif（WSO2社）：API分析と収益化
&lt;/h2&gt;

&lt;p&gt;Moesifは、実行中のAPIに対する分析、可観測性、収益化のためのツールです。ゲートウェイやAPI設計ツールではありません。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://wso2.com/library/blogs/wso2-acquires-api-analytics-and-monetization-leader-moesif/" rel="noopener noreferrer"&gt;WSO2は2025年5月にMoesifを買収&lt;/a&gt;し、WSO2のChoreoプラットフォームの分析レイヤーとして統合を進めています。Moesifは、独自のロードマップを持つ独立した子会社として引き続き運営されています。&lt;/p&gt;

&lt;p&gt;Moesifで確認できる主な情報は次のとおりです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;ユーザーごとのAPI利用状況&lt;/li&gt;
&lt;li&gt;エンドポイントごとのリクエスト傾向&lt;/li&gt;
&lt;li&gt;地域別トラフィック&lt;/li&gt;
&lt;li&gt;異常検出&lt;/li&gt;
&lt;li&gt;使用量ベース課金&lt;/li&gt;
&lt;li&gt;プラン管理&lt;/li&gt;
&lt;li&gt;顧客ダッシュボード&lt;/li&gt;
&lt;li&gt;APIコンシューマーのファネル分析&lt;/li&gt;
&lt;li&gt;リテンション分析&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;向いているのは、公開APIを運用しており、誰が、どのAPIを、いつ、どれだけ使っているかを把握したいチームです。使用量ベースの料金体系を導入する場合にも適しています。&lt;/p&gt;

&lt;p&gt;まだ公開APIを出荷していない場合や、ゲートウェイそのものが必要な場合には、Moesifは最初に導入するレイヤーではありません。&lt;/p&gt;

&lt;h2&gt;
  
  
  Thunder Client：VS CodeのRESTクライアント拡張機能
&lt;/h2&gt;

&lt;p&gt;Thunder Clientは、VS Code内でHTTPリクエストを送信するためのRESTクライアント拡張機能です。PostmanやInsomniaに近い用途ですが、エディタから離れずに使える点が特徴です。&lt;/p&gt;

&lt;p&gt;得意なことは次のとおりです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;VS Code内でREST APIをテストする&lt;/li&gt;
&lt;li&gt;コレクションをJSONとしてリポジトリに保存する&lt;/li&gt;
&lt;li&gt;Gitでリクエスト定義を管理する&lt;/li&gt;
&lt;li&gt;環境変数を使う&lt;/li&gt;
&lt;li&gt;基本的なテストアサーションを書く&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;一方で、以下は対象外です。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;チーム全体のAPIコラボレーション&lt;/li&gt;
&lt;li&gt;API設計プラットフォーム&lt;/li&gt;
&lt;li&gt;モックサーバー&lt;/li&gt;
&lt;li&gt;ドキュメント生成&lt;/li&gt;
&lt;li&gt;APIゲートウェイ&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;チームで使う場合は、コラボレーション機能の制約を確認してください。詳細は&lt;a href="http://apidog.com/blog/thunder-client-team-collaboration-limitations?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;チーム向けThunder Client：コラボレーションの制限&lt;/a&gt;で解説されています。&lt;/p&gt;

&lt;p&gt;Thunder Clientは、「コードを書きながらエンドポイントを素早く確認したい」ソロ開発者に向いています。設計、テスト、モック、ドキュメントまでチームで管理するなら、ApidogのようなAPIライフサイクルツールが適しています。&lt;/p&gt;

&lt;h2&gt;
  
  
  チームに適したツールの選び方
&lt;/h2&gt;

&lt;p&gt;まず、自分のチームにとっての「API管理」を定義してください。&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;やりたいこと&lt;/th&gt;
&lt;th&gt;適したツール&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;API設計、テスト、モック、ドキュメント&lt;/td&gt;
&lt;td&gt;Apidog&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;ゲートウェイ、ルーティング、JWT、レート制限&lt;/td&gt;
&lt;td&gt;Traefik&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;出荷済みAPIの分析、利用状況、課金&lt;/td&gt;
&lt;td&gt;Moesif&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;SaaS間のワークフロー自動化&lt;/td&gt;
&lt;td&gt;viaSocket&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;バックエンドを自動生成&lt;/td&gt;
&lt;td&gt;Backendless&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;WhatsApp Business連携&lt;/td&gt;
&lt;td&gt;Rasayel&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;VS Code内でRESTテスト&lt;/td&gt;
&lt;td&gt;Thunder Client&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;チーム規模でも選び方は変わります。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;ソロ開発者&lt;/strong&gt;：Thunder ClientまたはApidogの無料枠&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;5〜50人のチーム&lt;/strong&gt;：Apidog、Backendless、Traefik Hubを用途別に検討&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;100人以上の開発組織&lt;/strong&gt;：TraefikまたはKongをエッジに置き、Moesifで分析し、Apidogで設計とテストを管理する構成が現実的&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;制約別に見ると、次のようになります。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;予算重視&lt;/strong&gt;：Apidog無料枠、Traefik Proxy OSS、Backendless無料枠&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;導入スピード重視&lt;/strong&gt;：Apidog、viaSocket&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;ガバナンス重視&lt;/strong&gt;：Traefik Hub、Apidog、Moesif&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;関連情報として、&lt;a href="http://apidog.com/blog/api-testing-tool-team-50-engineers?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;50人エンジニアチームのためのAPIテストツール&lt;/a&gt;と、Apidog、Stoplight、SwaggerHubを比較した&lt;a href="http://apidog.com/blog/api-platform-design-first-api-workflow?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;デザインファーストAPIプラットフォーム比較&lt;/a&gt;も参考になります。&lt;/p&gt;

&lt;h2&gt;
  
  
  Spring 2026グリッドが教えてくれること
&lt;/h2&gt;

&lt;p&gt;G2のSpring 2026 API管理グリッドにある7つのツールは、すべてが同じ土俵で競合しているわけではありません。それぞれ、APIライフサイクルの異なる問題を解決しています。&lt;/p&gt;

&lt;p&gt;選定前に確認すべきポイントは次のとおりです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Apidogは、API設計、テスト、モック、ドキュメントをまとめたいチーム向け&lt;/li&gt;
&lt;li&gt;viaSocketは、ノーコードでSaaS連携を自動化したいチーム向け&lt;/li&gt;
&lt;li&gt;Traefikは、クラウドネイティブなゲートウェイ運用向け&lt;/li&gt;
&lt;li&gt;Rasayelは、WhatsApp Business API向け&lt;/li&gt;
&lt;li&gt;Backendlessは、BaaSとしてAPIを自動生成したいチーム向け&lt;/li&gt;
&lt;li&gt;Moesifは、API分析と収益化向け&lt;/li&gt;
&lt;li&gt;Thunder Clientは、VS Code内の軽量RESTテスト向け&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;チームがAPIの設計、テスト、モック、ドキュメントを扱うなら、まず&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;から試すのが実装しやすい選択です。&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidogをダウンロード&lt;/a&gt;すれば、Postmanからインポートして数分で既存APIのワークスペースを作成できます。&lt;/p&gt;

&lt;p&gt;ゲートウェイ側の選定については、&lt;a href="http://apidog.com/blog/best-api-gateways?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;2026年の開発者向けトップ10 APIゲートウェイ&lt;/a&gt;も参考になります。&lt;/p&gt;

</description>
    </item>
    <item>
      <title>Apidog A2Aデバッガーでエージェント間(A2A)プロトコルをデバッグする方法</title>
      <dc:creator>Akira</dc:creator>
      <pubDate>Fri, 15 May 2026 04:21:20 +0000</pubDate>
      <link>https://dev.to/aakira/apidog-a2adebatugadeezientojian-a2apurotokoruwodebatugusurufang-fa-4aoj</link>
      <guid>https://dev.to/aakira/apidog-a2adebatugadeezientojian-a2apurotokoruwodebatugusurufang-fa-4aoj</guid>
      <description>&lt;p&gt;他のAIエージェントと対話するAIエージェントを構築していると、すぐに「エージェント間で実際に何が送受信されているのか」を確認しづらい問題にぶつかります。コンソールログは断片的で、ブラウザのネットワークタブでは構造化フィールドを追いにくく、専用テストスクリプトは仕様変更ですぐ古くなります。ApidogのA2Aデバッガーを使うと、Agent2Agent（A2A）プロトコルのエージェントカードURLを貼り付け、接続し、メッセージを送信し、応答を3つのビューで確認できます。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;今すぐApidogを試す&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;このガイドでは、A2Aデバッガーでできること、最初のエージェントへの接続手順、リクエストとレスポンスの確認方法、そしてApidogの既存の&lt;a href="http://apidog.com/blog/test-mcp-servers-apidog-step-by-step-2?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;MCPサーバーテストツール&lt;/a&gt;との使い分けを実装目線で説明します。A2AとMCPの全体像を先に確認したい場合は、&lt;a href="http://apidog.com/blog/mcp-server-vs-a2a?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;ApidogのMCPとA2Aに関する詳細な記事&lt;/a&gt;も参考になります。&lt;/p&gt;

&lt;h2&gt;
  
  
  A2Aとは何か（要約）
&lt;/h2&gt;

&lt;p&gt;A2A（Agent2Agent）は、エージェント間通信のためのオープンプロトコルです。主に次の内容を定義します。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;エージェントが自身の能力をエージェントカードとして公開する方法&lt;/li&gt;
&lt;li&gt;別のエージェントがそのカードを使って接続する方法&lt;/li&gt;
&lt;li&gt;メッセージやファイル添付を交換する方法&lt;/li&gt;
&lt;li&gt;タスクのステータスを報告する方法&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;HTTPがWeb上の通信の共通レイヤーであるように、A2Aはエージェント間トラフィックの共通レイヤーとして機能します。たとえば、データパイプライン内のLangGraphエージェントが、別チームのCrewAIエージェントに内部実装を知らずにリクエストを送る、といった構成を実現できます。&lt;/p&gt;

&lt;p&gt;MCP（Model Context Protocol）は、単一のエージェントにツールやリソースへのアクセスを提供するためのプロトコルです。一方、A2Aはエージェント同士の通信に焦点を当てます。違いを詳しく確認したい場合は、&lt;a href="http://apidog.com/blog/mcp-server-vs-a2a?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;MCPとA2Aの違いの解説&lt;/a&gt;を参照してください。&lt;/p&gt;

&lt;h2&gt;
  
  
  A2Aデバッガーでできること
&lt;/h2&gt;

&lt;p&gt;&lt;a href="https://docs.apidog.com/a2a-debugger-2152018m0?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;A2Aデバッガー&lt;/a&gt;は&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;内で利用できる、A2Aエンドポイント用のビジュアルデバッグ環境です。本番ワークフローに組み込む前に、接続、認証、メッセージ送信、応答構造を確認できます。&lt;/p&gt;

&lt;p&gt;主な機能は次のとおりです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;エージェントカード接続&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
URLを貼り付けて「接続」をクリックすると、エージェント名、説明、機能、宣言されたスキル、プロトコルバージョンを確認できます。カード形式が不正な場合は接続エラーとして検出できます。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;メッセージ送信&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
プレーンテキストを送信し、必要に応じてファイル添付やカスタムメタデータを追加できます。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;3つの応答ビュー&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
プレビュー、コンテンツ、生データの3種類で同じ応答を確認できます。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;認証設定&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
ベアラートークン、基本認証、カスタムヘッダー経由のAPIキーをUIから設定できます。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;カスタムヘッダー&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
ゲートウェイ認証、テナントID、トレースID、ビジネスパラメータなどをHTTPヘッダーとして追加できます。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;セッション履歴&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
送信したメッセージと応答がセッション内に残るため、同じ接続で複数のケースを比較できます。&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;curlコマンドを手書きする必要はありません。ApidogがJSON-RPCエンベロープ、SSEストリーミング（エージェントがサポートしている場合）、応答の解析を処理します。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F42d74nwa2mulcrb1wdqz.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F42d74nwa2mulcrb1wdqz.png" alt="A2Aデバッガー画面" width="800" height="438"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  ステップ1：最初のA2Aエージェントに接続する
&lt;/h2&gt;

&lt;p&gt;デバッガーを開く前に、次の3つを準備します。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;最新のApidogクライアント&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
A2Aデバッガーを使うには、対応バージョンのApidogが必要です。未インストールの場合は、&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidogをダウンロード&lt;/a&gt;してください。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;エージェントカードのURL&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
A2A準拠エージェントの標準的なエントリポイントです。ローカル開発では、たとえば次のようなURLになります。&lt;br&gt;
&lt;/p&gt;&lt;/li&gt;
&lt;/ol&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;   http://localhost:3000/.well-known/agent.json
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;認証情報（必要な場合）&lt;/strong&gt;
ベアラートークン、APIキー、基本認証情報などを用意します。&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;接続手順は次のとおりです。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;Apidogを開く&lt;/li&gt;
&lt;li&gt;A2Aデバッガーページに移動する&lt;/li&gt;
&lt;li&gt;上部の入力欄にエージェントカードURLを貼り付ける&lt;/li&gt;
&lt;li&gt;必要に応じて認証情報やヘッダーを設定する&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;接続&lt;/strong&gt;をクリックする&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;有効なエージェントカードが返ると、ステータスが&lt;strong&gt;接続済み&lt;/strong&gt;になり、パネルに次のようなメタデータが表示されます。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;エージェント名&lt;/li&gt;
&lt;li&gt;説明&lt;/li&gt;
&lt;li&gt;機能&lt;/li&gt;
&lt;li&gt;宣言されたスキル&lt;/li&gt;
&lt;li&gt;プロトコルバージョン&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;接続に失敗した場合は、次を確認してください。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;URLが正しいか&lt;/li&gt;
&lt;li&gt;エージェントプロセスが起動しているか&lt;/li&gt;
&lt;li&gt;ブラウザでURLにアクセスするとJSONが返るか&lt;/li&gt;
&lt;li&gt;エージェントカードに必須フィールドがあるか&lt;/li&gt;
&lt;li&gt;
&lt;a href="https://github.com/google/A2A" rel="noopener noreferrer"&gt;GitHubのA2Aプロトコル仕様&lt;/a&gt;とカード構造が一致しているか&lt;/li&gt;
&lt;li&gt;ディスカバリーエンドポイントで認証が必要な場合、Apidog側に資格情報を設定しているか&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  ステップ2：テストメッセージを送信する
&lt;/h2&gt;

&lt;p&gt;接続できたら、&lt;strong&gt;メッセージ&lt;/strong&gt;タブを開きます。チャットUIと同じ感覚でプロンプトを入力します。&lt;/p&gt;

&lt;p&gt;例：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;共有ナレッジベースにある最新の3つの顧客フィードバックを要約し、サポートチーム向けに1段落の返信を作成してください。
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;送信前に、必要に応じて次を追加します。&lt;/p&gt;

&lt;h3&gt;
  
  
  ファイル添付
&lt;/h3&gt;

&lt;p&gt;クリップアイコンからファイルを選択します。デバッガーはエージェントが宣言している入力タイプを確認し、サポートされていないファイルタイプを事前に拒否します。これにより、不要な415エラーの往復を減らせます。&lt;/p&gt;

&lt;h3&gt;
  
  
  カスタムメタデータ
&lt;/h3&gt;

&lt;p&gt;メッセージごとのコンテキストをキーと値で追加できます。&lt;/p&gt;

&lt;p&gt;例：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;priority: high
tenant: acme-corp
locale: ja-JP
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;これらはA2Aリクエストエンベロープに含まれ、エージェント側のハンドラーが読み取れる場合に利用されます。&lt;/p&gt;

&lt;p&gt;準備できたら、&lt;strong&gt;送信&lt;/strong&gt;をクリックします。Apidogは入力内容をA2Aメッセージ構造にラップし、エージェントへ送信して応答を待ちます。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fai3jv0dp8kilxqg0bfjt.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fai3jv0dp8kilxqg0bfjt.png" alt="A2Aメッセージ送信画面" width="800" height="438"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  ステップ3：3つのビューで応答を確認する
&lt;/h2&gt;

&lt;p&gt;A2Aの応答は、プレーンテキスト、構造化JSON、ファイル参照、またはそれらの組み合わせで返ることがあります。Apidogでは、同じペイロードを3つのビューで確認できます。&lt;/p&gt;

&lt;h3&gt;
  
  
  プレビュー
&lt;/h3&gt;

&lt;p&gt;構造化フィールドをツリー形式で表示します。次のようなネストされた情報を追うときに便利です。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;タスクID&lt;/li&gt;
&lt;li&gt;ステータス&lt;/li&gt;
&lt;li&gt;成果物&lt;/li&gt;
&lt;li&gt;履歴&lt;/li&gt;
&lt;li&gt;エラー詳細&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  コンテンツ
&lt;/h3&gt;

&lt;p&gt;人間が読む本文を表示します。エージェントがテキストを返した場合、実際にユーザーへ表示する内容に近いビューです。&lt;/p&gt;

&lt;h3&gt;
  
  
  生データ
&lt;/h3&gt;

&lt;p&gt;完全なJSON-RPCペイロードを表示します。仕様準拠の確認、バグレポート、フィールド名やエスケープ文字の確認に使います。&lt;/p&gt;

&lt;p&gt;デバッグ時は、まず&lt;strong&gt;生データ&lt;/strong&gt;を確認するのがおすすめです。たとえば次のように切り分けられます。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;プレビューは正しいがコンテンツが空&lt;br&gt;&lt;br&gt;
→ エージェントがApidogでレンダリング可能だが、テキストとして平坦化できない型のアーティファクトを返している可能性があります。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;生データに&lt;code&gt;error.message&lt;/code&gt;がある&lt;br&gt;&lt;br&gt;
→ エージェント側がリクエストを拒否しています。エラーコードとメッセージを確認します。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;応答構造は正しいが内容が期待と違う&lt;br&gt;&lt;br&gt;
→ トランスポートではなく、プロンプト、モデル、エージェントロジック側の問題として切り分けられます。&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;セッション履歴は左側のパネルに表示されます。古い文脈が次のテストに影響しないようにしたい場合は、&lt;strong&gt;クリア&lt;/strong&gt;をクリックして履歴をリセットします。&lt;/p&gt;

&lt;h2&gt;
  
  
  認証：3つの一般的なパターン
&lt;/h2&gt;

&lt;p&gt;本番環境のA2Aエンドポイントは、多くの場合、認証の背後にあります。Apidogでは、よく使われる3つのパターンをUIから設定できます。&lt;/p&gt;

&lt;h3&gt;
  
  
  ベアラートークン
&lt;/h3&gt;

&lt;p&gt;ホスト型エージェントでよく使われる形式です。認証パネルで&lt;strong&gt;ベアラートークン&lt;/strong&gt;を選択し、トークンを貼り付けます。&lt;/p&gt;

&lt;p&gt;Apidogは各リクエストに次のヘッダーを追加します。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight http"&gt;&lt;code&gt;&lt;span class="err"&gt;Authorization: Bearer sk-agent-7f3e9a...
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h3&gt;
  
  
  基本認証
&lt;/h3&gt;

&lt;p&gt;ユーザー名とパスワードで保護された内部システムやレガシーシステムで使われます。&lt;strong&gt;基本認証&lt;/strong&gt;を選択し、ユーザー名とパスワードを入力すると、ApidogがBase64エンコード済みの&lt;code&gt;Authorization: Basic ...&lt;/code&gt;ヘッダーを生成します。&lt;/p&gt;

&lt;h3&gt;
  
  
  カスタムヘッダー経由のAPIキー
&lt;/h3&gt;

&lt;p&gt;エージェントが非標準のヘッダー名を期待する場合は、&lt;strong&gt;ヘッダー&lt;/strong&gt;セクションに手動で追加します。&lt;/p&gt;

&lt;p&gt;例：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight http"&gt;&lt;code&gt;&lt;span class="err"&gt;X-Agent-Key: your-api-key
X-Tenant-Id: acme-corp
X-Request-Id: debug-001
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;CSRFトークン、テナントID、リクエスト署名など、ゲートウェイ固有のヘッダーも同じ方法で追加できます。&lt;/p&gt;

&lt;p&gt;エージェント資格情報の管理については、&lt;a href="http://apidog.com/blog/secure-ai-agent-api-credentials?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog AIエージェント資格情報ガイド&lt;/a&gt;で、ローテーション、スコープ、コミットしてはいけない情報について説明しています。&lt;/p&gt;

&lt;h2&gt;
  
  
  カスタムヘッダーとメタデータ：どちらをいつ使うか
&lt;/h2&gt;

&lt;p&gt;A2Aリクエストには、追加データを置ける場所が2つあります。どちらもキーと値を扱えますが、属するレイヤーが異なります。&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;チャネル&lt;/th&gt;
&lt;th&gt;場所&lt;/th&gt;
&lt;th&gt;用途&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;カスタムヘッダー&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;HTTPリクエストヘッダー&lt;/td&gt;
&lt;td&gt;ゲートウェイ認証、可観測性（&lt;code&gt;X-Request-Id&lt;/code&gt;）、機能フラグ&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;メタデータ&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;A2Aメッセージペイロード&lt;/td&gt;
&lt;td&gt;エージェントが読むメッセージごとのコンテキスト（優先度、テナント、ロケール）&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;判断基準はシンプルです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;リバースプロキシ、APIゲートウェイ、監視基盤が使う値&lt;br&gt;&lt;br&gt;
→ &lt;strong&gt;ヘッダー&lt;/strong&gt;に置く&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;エージェントのタスクハンドラーが使う値&lt;br&gt;&lt;br&gt;
→ &lt;strong&gt;メタデータ&lt;/strong&gt;に置く&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;この2つを混同すると、「ヘッダーに入れたのにエージェントが読めない」「メタデータに入れたのにゲートウェイが認識しない」といった問題が起きます。&lt;/p&gt;

&lt;h2&gt;
  
  
  ApidogにおけるA2AデバッガーとMCPサーバーテストの比較
&lt;/h2&gt;

&lt;p&gt;Apidogは&lt;a href="http://apidog.com/blog/apidog-april-updates-ai-agent-a2a-debugger-easier-postman-migration?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;A2AデバッガーとMCPテストフロー&lt;/a&gt;の両方を提供しています。ただし、対象とするプロトコルとテスト内容は異なります。&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;ツール&lt;/th&gt;
&lt;th&gt;プロトコル&lt;/th&gt;
&lt;th&gt;テスト項目&lt;/th&gt;
&lt;th&gt;使用する状況&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;A2Aデバッガー&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Agent2Agent&lt;/td&gt;
&lt;td&gt;接続性、メッセージ交換、タスクステータス&lt;/td&gt;
&lt;td&gt;エージェントが他のエージェントを呼び出すマルチエージェントシステムを構築する場合&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;MCPサーバーテスト&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Model Context Protocol&lt;/td&gt;
&lt;td&gt;ツール呼び出し、リソースアクセス、プロンプトテンプレート&lt;/td&gt;
&lt;td&gt;エージェントにツールやリソースを公開するMCPサーバーを構築する場合&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;どちらを使うべきか迷った場合は、&lt;a href="http://apidog.com/blog/mcp-server-vs-a2a?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;MCPとA2Aのガイド&lt;/a&gt;を確認してください。&lt;/p&gt;

&lt;p&gt;短くまとめると、次のようになります。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;MCP&lt;/strong&gt;：エージェントが外部システム、ツール、リソースへアクセスするためのプロトコル&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;A2A&lt;/strong&gt;：エージェントが他のエージェントと通信するためのプロトコル&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;MCP側のワークフローについては、&lt;a href="http://apidog.com/blog/mcp-server-testing-apidog?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;MCPサーバーテストプレイブック&lt;/a&gt;で、Apidogにおける手動および自動テストの流れを説明しています。現実のエージェントシステムでは、A2Aによるエージェント間連携と、MCPによるツールアクセスを組み合わせるケースが多くなります。&lt;/p&gt;

&lt;h2&gt;
  
  
  一般的なデバッグパターン：タスクの往復を切り分ける
&lt;/h2&gt;

&lt;p&gt;「エージェントが期待通りに応答しない」ときは、次のループで確認します。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;A2Aデバッガーを開く&lt;/li&gt;
&lt;li&gt;エージェントカードURLで接続する&lt;/li&gt;
&lt;li&gt;エージェントカードに期待するスキルが表示されているか確認する&lt;/li&gt;
&lt;li&gt;そのスキルをトリガーする最小限のメッセージを送る&lt;/li&gt;
&lt;li&gt;最初はファイルやメタデータを付けず、プレーンテキストだけで試す&lt;/li&gt;
&lt;li&gt;応答の&lt;strong&gt;生データ&lt;/strong&gt;を確認する&lt;/li&gt;
&lt;li&gt;期待するフィールドが欠落している場合は、エージェントコード側を確認する&lt;/li&gt;
&lt;li&gt;応答構造は正しいが内容が違う場合は、プロンプトやモデル出力を確認する&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;この流れにより、問題を次のどちらかに分離できます。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;通信、認証、A2Aエンベロープの問題&lt;/li&gt;
&lt;li&gt;エージェントのロジック、プロンプト、モデル応答の問題&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;これは、&lt;a href="http://apidog.com/blog/how-to-test-ai-agents-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;APIを呼び出すAIエージェントをテストする方法&lt;/a&gt;で説明している「非難する前に分離する」デバッグループと同じ考え方です。まず通信を確認し、その後でロジックをデバッグします。&lt;/p&gt;

&lt;h2&gt;
  
  
  AIワークフローにおける位置付け
&lt;/h2&gt;

&lt;p&gt;マルチエージェントシステムでは、エージェント同士の通信を通常のAPIトラフィックと同じように観測、検証、デバッグできる必要があります。&lt;a href="http://apidog.com/blog/ai-agents-new-api-consumers?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;AIエージェントは新しいAPIコンシューマーである&lt;/a&gt;という記事では、エージェントトラフィックを第一級のAPI利用者として扱う理由を説明しています。&lt;/p&gt;

&lt;p&gt;また、&lt;a href="http://apidog.com/blog/design-apis-ai-agents?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;AIエージェント向けAPIの設計&lt;/a&gt;では、APIの利用者が人間の開発者ではなくLLM駆動型エージェントになる場合に、API契約やエラーメッセージ設計をどう変えるべきかを解説しています。&lt;/p&gt;

&lt;p&gt;A2Aデバッガーは、Apidogの&lt;a href="http://apidog.com/blog/from-apis-to-ai-agents-visual-debugging-with-apidog-mcp-client?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;MCPクライアントビジュアルデバッガー&lt;/a&gt;と同じく、SDK内部に隠れがちなエージェント通信を可視化するためのツールです。&lt;/p&gt;

&lt;p&gt;エージェントを接続し、送受信されるデータを確認し、本番環境に到達する前にバグを修正できます。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;は無料でダウンロードでき、A2Aデバッガーは標準クライアントに含まれています。別途ライセンスやプランは不要です。&lt;/p&gt;

&lt;h2&gt;
  
  
  よくある質問
&lt;/h2&gt;

&lt;h3&gt;
  
  
  A2Aデバッガーは無料ですか？
&lt;/h3&gt;

&lt;p&gt;はい。標準のApidogクライアントにバンドルされています。&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidogをダウンロード&lt;/a&gt;し、対応バージョンを使用していれば、A2Aデバッガーがサイドパネルに表示されます。&lt;/p&gt;

&lt;h3&gt;
  
  
  あらゆるフレームワークで書かれたエージェントに対応していますか？
&lt;/h3&gt;

&lt;p&gt;有効なA2Aエージェントカードを公開しているエージェントであれば利用できます。A2Aはフレームワークに依存しないため、LangGraph、CrewAI、AutoGen、カスタムのPythonまたはGoエージェントでも、A2A仕様に準拠していれば動作します。&lt;/p&gt;

&lt;h3&gt;
  
  
  セッションを保存して後で再生できますか？
&lt;/h3&gt;

&lt;p&gt;セッションはデバッガーを開いている間は保持されます。長期保存したい場合は、生データの出力をコピーしてテスト成果物として保存してください。完全なセッションエクスポートはロードマップにあります。&lt;/p&gt;

&lt;h3&gt;
  
  
  ストリーミング応答はどのように処理されますか？
&lt;/h3&gt;

&lt;p&gt;エージェントがA2A仕様に基づくSSEストリーミングをサポートしている場合、デバッガーはチャンクが到着するたびに読み取り、プレビューとコンテンツをリアルタイムで更新します。ストリームが閉じると、生データに組み立てられた応答が表示されます。&lt;/p&gt;

&lt;h3&gt;
  
  
  メタデータフィールドとヘッダーセクションの違いは何ですか？
&lt;/h3&gt;

&lt;p&gt;ヘッダーはHTTPレイヤー、メタデータはA2Aメッセージレイヤーです。ヘッダーはゲートウェイやリバースプロキシに届き、メタデータはエージェントのタスクハンドラーに届きます。判断に迷った場合は、前述の比較表を参照してください。&lt;/p&gt;

&lt;h3&gt;
  
  
  Apidogはエージェントの応答をApidogのサーバーにログ記録しますか？
&lt;/h3&gt;

&lt;p&gt;いいえ。Apidogはローカルクライアントとして動作します。お使いのマシンとエージェント間のトラフィックは、Apidogのインフラストラクチャを通過しません。&lt;/p&gt;

&lt;h3&gt;
  
  
  A2Aデバッガーで、異なるネットワーク上のホスト型エージェントをテストできますか？
&lt;/h3&gt;

&lt;p&gt;はい。ネットワークパスが開いていれば可能です。デバッガーは通常のHTTPクライアントと同じようにアウトバウンドHTTPSリクエストを送信します。エージェントがVPNの背後にある場合は、そのVPNに接続してからテストしてください。&lt;/p&gt;

&lt;h3&gt;
  
  
  バグ報告や機能リクエストはどこに送ればよいですか？
&lt;/h3&gt;

&lt;p&gt;Apidogに関するフィードバックは、Apidogのフィードバックチャネルに送ってください。A2A仕様そのものに関するリクエストは、&lt;a href="https://github.com/google/A2A" rel="noopener noreferrer"&gt;A2AプロトコルのGitHubリポジトリ&lt;/a&gt;に提出してください。&lt;/p&gt;

&lt;h2&gt;
  
  
  今すぐ試す
&lt;/h2&gt;

&lt;p&gt;まず、アクセスできる最もシンプルなA2Aエージェントを用意します。まだエージェントがない場合は、&lt;a href="https://google.github.io/A2A/" rel="noopener noreferrer"&gt;A2Aリファレンス実装&lt;/a&gt;に含まれるサンプルサーバーをローカルで実行できます。&lt;/p&gt;

&lt;p&gt;最小の確認手順は次のとおりです。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;サンプルまたは既存のA2Aエージェントを起動する&lt;/li&gt;
&lt;li&gt;エージェントカードURLを確認する&lt;/li&gt;
&lt;li&gt;ApidogのA2AデバッガーにURLを貼り付ける&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;接続&lt;/strong&gt;をクリックする&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;hello&lt;/code&gt;のような短いメッセージを送る&lt;/li&gt;
&lt;li&gt;プレビュー、コンテンツ、生データの3つのビューを確認する&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;これが最小限のエンドツーエンドループです。ここから、実際のプロンプト、ファイル添付、メタデータ、マルチエージェントワークフローへ段階的に広げていけます。&lt;/p&gt;

&lt;p&gt;A2Aデバッガーを&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;のAPIおよびMCP機能と組み合わせることで、HTTP、MCP、A2Aというエージェントシステムの主要な通信レイヤーを1つのインターフェースで確認できます。&lt;/p&gt;

</description>
    </item>
    <item>
      <title>スマホでOpenAI Codexを使う方法：2026年iOS＆Androidガイド</title>
      <dc:creator>Akira</dc:creator>
      <pubDate>Fri, 15 May 2026 03:05:29 +0000</pubDate>
      <link>https://dev.to/aakira/sumahodeopenai-codexwoshi-ufang-fa-2026nian-iosandroidgaido-3do1</link>
      <guid>https://dev.to/aakira/sumahodeopenai-codexwoshi-ufang-fa-2026nian-iosandroidgaido-3do1</guid>
      <description>&lt;p&gt;OpenAIは今週、モバイル版Codexをリリースしました。2026年5月14日、iOSおよびAndroid版ChatGPTアプリに、無料プランやGoプランを含むすべてのプランでフル機能のCodexエクスペリエンスが追加されました。これにより、ラップトップがスリープしていても、スマートフォンから実行中タスクの監視、コマンド承認、モデル切り替え、新規作業の開始ができます。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;今すぐApidogを試す&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;Apidog読者からは、本格的なAIコーディングをスマートフォンでいつ使えるのかという質問がありました。答えは「今」です。この記事では、モバイル版Codexでできること、セットアップ手順、最初に試すべき実装フローをまとめます。&lt;/p&gt;

&lt;p&gt;ターミナルで動くコーディングエージェントの前提を確認したい場合は、&lt;a href="http://apidog.com/blog/openai-codex-cli?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Codex CLIのセットアップガイド&lt;/a&gt;を参照してください。AnthropicやCursorのモバイル運用と比較したい場合は、&lt;a href="http://apidog.com/blog/claude-code-mobile?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;モバイル版Claude Codeのウォークスルー&lt;/a&gt;と&lt;a href="http://apidog.com/blog/cursor-ai-phone?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;スマートフォンでCursorを実行する記事&lt;/a&gt;が参考になります。API開発と組み合わせる場合は、&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;でAPI設計・テスト環境を用意しておくと、Codexが生成した変更を検証しやすくなります。&lt;/p&gt;

&lt;h2&gt;
  
  
  「どこからでもCodex」とは
&lt;/h2&gt;

&lt;p&gt;OpenAIの今回の発表は、モバイルアプリだけではありません。「どこからでもCodex」は、次の4つのインターフェースを指します。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;ChatGPTモバイルアプリでのCodex&lt;/strong&gt;：iOS、Android、プレビュー、全プラン対応&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;SlackでのCodex&lt;/strong&gt;：Plus、Pro、Business、Enterprise、Eduで利用可能。スレッドで&lt;code&gt;@Codex&lt;/code&gt;をメンション&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Codex Chrome拡張機能&lt;/strong&gt;：2026年5月7日リリース。ブラウザを占有せずにタブ間で動作&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Codex SDK&lt;/strong&gt;：自社スクリプトやCIからCodexをプログラム制御&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;モバイル版の主な価値は、コードを書く場所をスマートフォンに移すことではなく、&lt;strong&gt;実行中のエージェント作業を外出先から制御できること&lt;/strong&gt;です。&lt;/p&gt;

&lt;p&gt;たとえば、次のような運用ができます。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;SlackスレッドでCodexに修正タスクを渡す&lt;/li&gt;
&lt;li&gt;Codexがクラウド環境で作業する&lt;/li&gt;
&lt;li&gt;スマートフォンで差分とログを確認する&lt;/li&gt;
&lt;li&gt;問題なければ承認する&lt;/li&gt;
&lt;li&gt;CIやAPIテストを通してマージ判断する&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fyvzh6bmfis3hhdukzxep.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fyvzh6bmfis3hhdukzxep.png" alt="Codex mobile" width="800" height="558"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  iOSとAndroidでCodexをセットアップする
&lt;/h2&gt;

&lt;p&gt;モバイル版Codexは、既存のChatGPTアプリ内に組み込まれています。別アプリのインストールは不要です。&lt;/p&gt;

&lt;h3&gt;
  
  
  ステップ1：ChatGPTアプリをアップデートする
&lt;/h3&gt;

&lt;p&gt;iOSではApp Store、AndroidではPlay Storeを開き、ChatGPTアプリを最新バージョンに更新します。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://developers.openai.com/codex/changelog" rel="noopener noreferrer"&gt;Codexの変更履歴&lt;/a&gt;によると、モバイル版Codexには2026年5月13日以降のリリースが必要です。&lt;/p&gt;

&lt;h3&gt;
  
  
  ステップ2：デスクトップ版と同じアカウントでサインインする
&lt;/h3&gt;

&lt;p&gt;モバイル版Codexは、Web版と同じスレッド、環境、接続済みホストを参照します。&lt;/p&gt;

&lt;p&gt;すでにChatGPTまたはCodex CLIで使っているOpenAIアカウントでログインしてください。&lt;/p&gt;

&lt;h3&gt;
  
  
  ステップ3：クラウド環境を接続する
&lt;/h3&gt;

&lt;p&gt;ターミナルだけでCodexを使っている場合、モバイルアプリから操作するには少なくとも1つのクラウド環境が必要です。&lt;/p&gt;

&lt;p&gt;Webアプリで次の順に設定します。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;設定&lt;/strong&gt;を開く&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Codex&lt;/strong&gt;を選択&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;環境&lt;/strong&gt;に移動&lt;/li&gt;
&lt;li&gt;GitHubを連携&lt;/li&gt;
&lt;li&gt;対象リポジトリを設定&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;モバイル版はこの設定を引き継ぎます。&lt;/p&gt;

&lt;h3&gt;
  
  
  ステップ4：Codexタブを開く
&lt;/h3&gt;

&lt;p&gt;ChatGPTアプリの下部ナビゲーションで、&lt;strong&gt;Codex&lt;/strong&gt;をタップします。&lt;/p&gt;

&lt;p&gt;ここに、アクティブなタスクとスレッドが一覧表示されます。&lt;/p&gt;

&lt;h3&gt;
  
  
  ステップ5：小さなテストタスクを実行する
&lt;/h3&gt;

&lt;p&gt;最初は、リスクの低い変更から試してください。&lt;/p&gt;

&lt;p&gt;例：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;READMEにセットアップ手順の1行説明を追加してください。
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;または：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;この関数にdocstringを追加してください。挙動は変更しないでください。
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;確認ポイントは次の通りです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;スマートフォンに差分が表示されるか&lt;/li&gt;
&lt;li&gt;実行ログを確認できるか&lt;/li&gt;
&lt;li&gt;承認フローが機能するか&lt;/li&gt;
&lt;li&gt;PRまたはブランチへの反映が期待通りか&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;この最小フローが動けば、長時間実行タスクや複数ファイル修正にも進めます。&lt;/p&gt;

&lt;h2&gt;
  
  
  スマートフォンからできること
&lt;/h2&gt;

&lt;p&gt;モバイル版Codexは、スマートフォンをコードエディタにするというより、&lt;strong&gt;リモートコーディングエージェントのコントロールパネル&lt;/strong&gt;として使います。&lt;/p&gt;

&lt;p&gt;スマートフォンから可能な操作は次の通りです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;ラップトップ、開発ボックス、接続済みリモート環境での&lt;strong&gt;ライブ実行を監視&lt;/strong&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;スレッドを閲覧&lt;/strong&gt;し、並行タスクを切り替え&lt;/li&gt;
&lt;li&gt;ブランチにマージされる前の&lt;strong&gt;差分をレビュー&lt;/strong&gt;
&lt;/li&gt;
&lt;li&gt;Codexが実行したい&lt;strong&gt;コマンドを承認&lt;/strong&gt;
&lt;/li&gt;
&lt;li&gt;必要に応じてタスク途中で&lt;strong&gt;モデルを切り替え&lt;/strong&gt;
&lt;/li&gt;
&lt;li&gt;新しいプロンプトまたはGitHubイシューから&lt;strong&gt;新規タスクを開始&lt;/strong&gt;
&lt;/li&gt;
&lt;li&gt;Codexが作成した&lt;strong&gt;プルリクエストにコメント&lt;/strong&gt;
&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;OpenAIの説明では、スマートフォンから「すべてのスレッドにわたって作業し、出力をレビューし、コマンドを承認し、モデルを変更し、新しい作業を開始」できます。&lt;/p&gt;

&lt;p&gt;ただし、モバイル版はVS Codeのような本格的なエディタではありません。直接コードを細かく編集するのではなく、Codexに指示し、生成された変更を確認・承認する使い方になります。&lt;/p&gt;

&lt;h2&gt;
  
  
  SlackからCodexに作業を依頼する
&lt;/h2&gt;

&lt;p&gt;Slack連携は、モバイル版と同時にリリースされました。チーム運用では、SlackがCodexへのタスク投入口になります。&lt;/p&gt;

&lt;h3&gt;
  
  
  仕組み
&lt;/h3&gt;

&lt;p&gt;ワークスペース管理者が&lt;a href="https://slack.com/marketplace/A09F5C369E3-openai-codex" rel="noopener noreferrer"&gt;Codex Slackアプリ&lt;/a&gt;をインストールした後、チャンネルまたはスレッドで&lt;code&gt;@Codex&lt;/code&gt;をメンションします。&lt;/p&gt;

&lt;p&gt;例：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;@Codex このIssueの再現テストを追加し、失敗するテストを修正してください。
対象リポジトリは api-service です。
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Codexは次のように動作します。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;設定済み環境から適切なものを選択&lt;/li&gt;
&lt;li&gt;環境マップの最初のリポジトリをデフォルトとして使用&lt;/li&gt;
&lt;li&gt;リポジトリ指定があれば上書き&lt;/li&gt;
&lt;li&gt;絵文字で反応&lt;/li&gt;
&lt;li&gt;タスクリンクを投稿&lt;/li&gt;
&lt;li&gt;作業完了後に結果をスレッドへ返信&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  必要なもの
&lt;/h3&gt;

&lt;p&gt;Slack連携には次が必要です。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;ChatGPT Plus、Pro、Business、Enterprise、またはEduプラン&lt;/li&gt;
&lt;li&gt;接続済みGitHubアカウント&lt;/li&gt;
&lt;li&gt;少なくとも1つの設定済みクラウド環境&lt;/li&gt;
&lt;li&gt;Slackアプリをインストールするためのワークスペース管理者承認&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;無料プランはSlack連携の対象外です。&lt;/p&gt;

&lt;p&gt;Enterprise管理者は、Codexの回答投稿を無効にし、タスクリンクのみを共有させる設定もできます。これにより、生成コードがSlackチャンネルの履歴に残ることを避けられます。&lt;/p&gt;

&lt;h3&gt;
  
  
  実用パターン：Issueトリアージ
&lt;/h3&gt;

&lt;p&gt;GitHub IssueをSlackチャンネルに流しているチームでは、次の流れが実用的です。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;新規IssueがSlackに投稿される&lt;/li&gt;
&lt;li&gt;担当者がスレッドで&lt;code&gt;@Codex&lt;/code&gt;に再現・修正を依頼&lt;/li&gt;
&lt;li&gt;Codexが修正案またはPRを作成&lt;/li&gt;
&lt;li&gt;人間がスマートフォンまたはデスクトップでレビュー&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;似た運用例として、&lt;a href="http://apidog.com/blog/clawsweeper-openclaw-github-triage-bot?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;OpenClaw GitHubトリアージボット&lt;/a&gt;の記事も参考になります。&lt;/p&gt;

&lt;h2&gt;
  
  
  Codex SDKでプログラム制御する
&lt;/h2&gt;

&lt;p&gt;Codex SDKは、チーム内ツール、スケジューラ、CIランナーからCodexを操作したい場合に使います。&lt;/p&gt;

&lt;p&gt;一般的な構成は次のようになります。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight python"&gt;&lt;code&gt;&lt;span class="kn"&gt;from&lt;/span&gt; &lt;span class="n"&gt;openai&lt;/span&gt; &lt;span class="kn"&gt;import&lt;/span&gt; &lt;span class="n"&gt;Codex&lt;/span&gt;

&lt;span class="n"&gt;client&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="nc"&gt;Codex&lt;/span&gt;&lt;span class="p"&gt;()&lt;/span&gt;

&lt;span class="n"&gt;task&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;client&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;tasks&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;create&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="n"&gt;repo&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;apidog/awesome-api&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;prompt&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;Add OpenAPI examples to every endpoint missing them.&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;environment&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;prod-mirror&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="k"&gt;for&lt;/span&gt; &lt;span class="n"&gt;event&lt;/span&gt; &lt;span class="ow"&gt;in&lt;/span&gt; &lt;span class="n"&gt;client&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;tasks&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;stream&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;task&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nb"&gt;id&lt;/span&gt;&lt;span class="p"&gt;):&lt;/span&gt;
    &lt;span class="nf"&gt;print&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;event&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;summary&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;使いどころは次の通りです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;放置されたIssueに対して夜間ジョブでフォローアップPRを作る&lt;/li&gt;
&lt;li&gt;マージ前に不足しているテストをCodexに追加させる&lt;/li&gt;
&lt;li&gt;API仕様に対するサンプルやドキュメントの不足を検出して補完する&lt;/li&gt;
&lt;li&gt;CIの失敗内容をもとに修正候補を生成する&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Enterpriseワークスペースでは、非対話型フロー向けのアクセストークンを発行できます。この機能は2026年5月5日にリリースされました。&lt;/p&gt;

&lt;p&gt;すでに&lt;a href="http://apidog.com/blog/claude-code-github-actions?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;GitHub ActionsでClaude Code&lt;/a&gt;を使っているチームにとって、Codex SDKはOpenAI側で同様の役割を担います。&lt;/p&gt;

&lt;h2&gt;
  
  
  プラン、料金、提供状況
&lt;/h2&gt;

&lt;p&gt;モバイルプレビューは、無料プランおよびGoプランを含む&lt;strong&gt;すべてのプラン&lt;/strong&gt;で利用可能です。一方で、SlackやSDKなど一部インターフェースにはプラン制限があります。&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;インターフェース&lt;/th&gt;
&lt;th&gt;無料&lt;/th&gt;
&lt;th&gt;Go&lt;/th&gt;
&lt;th&gt;Plus&lt;/th&gt;
&lt;th&gt;Pro&lt;/th&gt;
&lt;th&gt;Business&lt;/th&gt;
&lt;th&gt;Enterprise / Edu&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;モバイル (iOS + Android)&lt;/td&gt;
&lt;td&gt;はい (プレビュー)&lt;/td&gt;
&lt;td&gt;はい&lt;/td&gt;
&lt;td&gt;はい&lt;/td&gt;
&lt;td&gt;はい&lt;/td&gt;
&lt;td&gt;はい&lt;/td&gt;
&lt;td&gt;はい&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Slack連携&lt;/td&gt;
&lt;td&gt;いいえ&lt;/td&gt;
&lt;td&gt;いいえ&lt;/td&gt;
&lt;td&gt;はい&lt;/td&gt;
&lt;td&gt;はい&lt;/td&gt;
&lt;td&gt;はい&lt;/td&gt;
&lt;td&gt;はい&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Chrome拡張機能&lt;/td&gt;
&lt;td&gt;はい (プレビュー)&lt;/td&gt;
&lt;td&gt;はい&lt;/td&gt;
&lt;td&gt;はい&lt;/td&gt;
&lt;td&gt;はい&lt;/td&gt;
&lt;td&gt;はい&lt;/td&gt;
&lt;td&gt;はい&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Codex SDK&lt;/td&gt;
&lt;td&gt;制限あり&lt;/td&gt;
&lt;td&gt;制限あり&lt;/td&gt;
&lt;td&gt;はい&lt;/td&gt;
&lt;td&gt;はい&lt;/td&gt;
&lt;td&gt;はい&lt;/td&gt;
&lt;td&gt;はい&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Enterpriseアクセストークン&lt;/td&gt;
&lt;td&gt;いいえ&lt;/td&gt;
&lt;td&gt;いいえ&lt;/td&gt;
&lt;td&gt;いいえ&lt;/td&gt;
&lt;td&gt;いいえ&lt;/td&gt;
&lt;td&gt;いいえ&lt;/td&gt;
&lt;td&gt;はい&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;Codexの費用を詳しく確認したい場合は、&lt;a href="http://apidog.com/blog/gpt-5-5-pricing?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;GPT-5.5の料金内訳&lt;/a&gt;にトークンごとの料金が記載されています。無料で試したい場合は、&lt;a href="http://apidog.com/blog/free-codex-open-source?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;オープンソース向けの無料Codexガイド&lt;/a&gt;を参照してください。&lt;/p&gt;

&lt;h2&gt;
  
  
  スマートフォン版Codexと競合製品の違い
&lt;/h2&gt;

&lt;p&gt;モバイルコーディングエージェントには複数の選択肢があります。代表的なものは次の3つです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;OpenAI Codex&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
ChatGPTとの統合が強く、モバイルUXが用意されています。無料プランでもモバイルプレビューを利用できます。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;モバイル版Claude Code&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
&lt;a href="http://apidog.com/blog/claude-code-mobile?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Claude Codeのモバイルセットアップ&lt;/a&gt;は、tmuxセッションとSSHクライアントを使う構成です。DIY要素は強いものの、長時間実行されるターミナル作業には向いています。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;スマートフォン版Cursor&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
&lt;a href="http://apidog.com/blog/cursor-ai-phone?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Cursorのモバイルワークフロー&lt;/a&gt;は、リモート開発とCursorのWebプレビューに依存します。デスクトップでCursorを多用しているチームに合います。&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;デスクトップ版を含めて比較したい場合は、&lt;a href="http://apidog.com/blog/claude-vs-codex-comparison-2026?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Claude Code vs Codex 2026の比較記事&lt;/a&gt;が分かりやすいです。より広く見るなら、&lt;a href="http://apidog.com/blog/codex-vs-claude-code-vs-cursor-vs-copilot?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Copilot vs Claude vs Cursor vs Codexの4者比較&lt;/a&gt;も参考になります。&lt;/p&gt;

&lt;h2&gt;
  
  
  API開発で組み合わせる実装フロー
&lt;/h2&gt;

&lt;p&gt;スマートフォン上のコーディングエージェントは、生成したコードが本番環境で正しく動く場合に価値があります。特にAPI変更では、契約の破壊やテスト漏れが問題になりやすいです。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;を使うと、APIクライアント、OpenAPIエディタ、自動テストランナーを組み合わせて、Codexの変更を検証できます。&lt;/p&gt;

&lt;p&gt;実用的なフローは次の通りです。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;CodexがモバイルまたはSlack経由でAPI関連のPRを作成&lt;/li&gt;
&lt;li&gt;ApidogのCIがプレビューデプロイに対して既存のOpenAPIテストスイートを実行&lt;/li&gt;
&lt;li&gt;テストがグリーンなら、スマートフォンから差分を承認&lt;/li&gt;
&lt;li&gt;問題があれば、失敗ログをもとにCodexへ追加修正を依頼&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;関連する実装例は、&lt;a href="http://apidog.com/blog/how-to-test-chatgpt-api-with-apidog?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog ChatGPT APIテストガイド&lt;/a&gt;と&lt;a href="http://apidog.com/blog/how-to-test-ai-agents-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;APIを呼び出すAIエージェントをテストする方法&lt;/a&gt;で説明されています。&lt;/p&gt;

&lt;p&gt;今すぐ試す場合は、&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidogをダウンロード&lt;/a&gt;して、APIテストスイートを先に用意しておくと安全です。&lt;/p&gt;

&lt;h2&gt;
  
  
  よくある質問
&lt;/h2&gt;

&lt;h3&gt;
  
  
  モバイル版Codexはオフラインで動作しますか？
&lt;/h3&gt;

&lt;p&gt;いいえ。CodexはOpenAIのクラウドまたは接続された環境で動作します。ネットワークがない場合、アプリは最後に認識したスレッド状態を表示できますが、新しいタスクは開始できません。&lt;/p&gt;

&lt;h3&gt;
  
  
  モバイルアプリで直接コードを編集できますか？
&lt;/h3&gt;

&lt;p&gt;期待されているようなエディタ操作はできません。プロンプト入力、レビュー、承認は可能です。モバイル版はエディタではなく、リモートエージェントのコントロールサーフェスです。&lt;/p&gt;

&lt;h3&gt;
  
  
  モバイル版はデスクトップ版より遅いですか？
&lt;/h3&gt;

&lt;p&gt;エージェント自体は同じバックエンドで動作します。遅く感じる主な理由は、スマートフォンの画面サイズです。長い差分はスマートフォンでは確認しづらいため、概要確認はモバイル、本格レビューはデスクトップという使い分けが現実的です。&lt;/p&gt;

&lt;h3&gt;
  
  
  モバイル版Codexは音声入力をサポートしていますか？
&lt;/h3&gt;

&lt;p&gt;既存のChatGPT音声モードを介して利用できます。他のChatGPTメッセージと同じように、Codexへのプロンプトを音声で入力できます。&lt;/p&gt;

&lt;h3&gt;
  
  
  承認中に通信が切れた場合はどうなりますか？
&lt;/h3&gt;

&lt;p&gt;タスクはクラウド側で実行され続けます。再接続すると状態が更新されます。Codexは、動作継続のためにモバイルセッションを開いたままにする必要はありません。&lt;/p&gt;

&lt;h3&gt;
  
  
  企業管理者はモバイル版Codexを無効にできますか？
&lt;/h3&gt;

&lt;p&gt;はい。ワークスペースのオーナーは、管理パネルからCodexへのアクセスを制限できます。デスクトップアクセスを制限するのと同じトグルがモバイルにも適用されます。&lt;/p&gt;

&lt;h3&gt;
  
  
  モバイル版Codexには追加料金がかかりますか？
&lt;/h3&gt;

&lt;p&gt;モバイルアプリ自体に追加料金はかかりません。ただし、利用プランに応じて、基礎となるCodexの計算量に対する料金が発生します。詳細は&lt;a href="http://apidog.com/blog/gpt-5-5-pricing?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Codexの料金に関する記事&lt;/a&gt;を参照してください。&lt;/p&gt;

&lt;h3&gt;
  
  
  これは古い「Codex」モデルとは異なりますか？
&lt;/h3&gt;

&lt;p&gt;はい。現在のCodexは、2021年に廃止された旧Codexモデルではなく、コーディングエージェント製品です。2026年時点の製品として理解するには、&lt;a href="http://apidog.com/blog/openai-codex-cli?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Codex CLIの紹介記事&lt;/a&gt;が参考になります。&lt;/p&gt;

&lt;h2&gt;
  
  
  今夜試す最小フロー
&lt;/h2&gt;

&lt;p&gt;まずは次の最小ループを試してください。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;ChatGPTアプリを更新する&lt;/li&gt;
&lt;li&gt;同じOpenAIアカウントでサインインする&lt;/li&gt;
&lt;li&gt;Codex用のクラウド環境をリンクする&lt;/li&gt;
&lt;li&gt;READMEの1行変更をCodexに依頼する&lt;/li&gt;
&lt;li&gt;スマートフォンで差分を確認する&lt;/li&gt;
&lt;li&gt;承認する&lt;/li&gt;
&lt;li&gt;CIまたはAPIテストの結果を確認する&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;この流れが動けば、Slack連携やSDKによる自動化を追加する価値があります。&lt;/p&gt;

&lt;p&gt;Codexがスマートフォンからデプロイする変更でもAPI契約を保ちたい場合は、&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;と組み合わせてください。エージェントがコードを書き、テストスイートが回帰を検出する構成にできます。&lt;/p&gt;

</description>
    </item>
    <item>
      <title>ERNIE 5.1 API の使い方</title>
      <dc:creator>Akira</dc:creator>
      <pubDate>Thu, 14 May 2026 08:34:40 +0000</pubDate>
      <link>https://dev.to/aakira/ernie-51-api-noshi-ifang-1jl2</link>
      <guid>https://dev.to/aakira/ernie-51-api-noshi-ifang-1jl2</guid>
      <description>&lt;p&gt;&lt;a href="https://ernie.baidu.com/blog/posts/ernie-5.1-0508-release/" rel="noopener noreferrer"&gt;ERNIE 5.1&lt;/a&gt;は2026年5月9日にリリースされ、1週間以内にQianfan APIが公開されました。独自コードからモデルを呼び出す、ツールコールをルーティングする、または&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;でエージェントループに接続する場合に必要な、アカウント作成、APIキー、リクエストボディ、ストリーミング、ツール使用、エラー処理を実装手順としてまとめます。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;今すぐApidogを試す&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;この記事では実装に必要な部分だけを扱います。最終的に、動作する&lt;code&gt;curl&lt;/code&gt;、Python、Node.jsのサンプルと、Apidogに取り込んで比較検証できるリクエスト構成を作れます。&lt;/p&gt;

&lt;p&gt;まだ読んでいない場合は、先に&lt;a href="http://apidog.com/blog/what-is-ernie-5-1?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;ERNIE 5.1の発表詳細&lt;/a&gt;を確認してください。&lt;a href="http://apidog.com/blog/what-is-deepseek-v4?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeek V4&lt;/a&gt;や&lt;a href="http://apidog.com/blog/what-is-kimi-k2-6?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Kimi K2.6&lt;/a&gt;とのベンチマークやトレードオフが整理されています。この記事は、その実装編です。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F05%2Fimage-83.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F05%2Fimage-83.png" alt="" width="800" height="556"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  ステップ1：Qianfan APIキーを取得する
&lt;/h2&gt;

&lt;p&gt;&lt;a href="http://apidog.com/blog/what-is-ernie-5-1/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;ERNIE 5.1&lt;/a&gt;は、Baidu Intelligent CloudのQianfanプラットフォーム経由で提供されます。独立した「ERNIE API」ではなく、API呼び出しはすべてQianfan経由です。&lt;/p&gt;

&lt;p&gt;手順は次のとおりです。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;a href="https://cloud.baidu.com" rel="noopener noreferrer"&gt;cloud.baidu.com&lt;/a&gt;にアクセスし、Baidu Intelligent Cloudアカウントを作成またはサインインします。国際開発者はメールで登録できますが、一部のエンタープライズ機能には中国本土の電話番号が必要です。&lt;/li&gt;
&lt;li&gt;
&lt;a href="https://console.bce.baidu.com/qianfan/" rel="noopener noreferrer"&gt;console.bce.baidu.com/qianfan&lt;/a&gt;でQianfanコンソールを開きます。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;API Key Management&lt;/strong&gt;（&lt;code&gt;API Key 管理&lt;/code&gt;）で、&lt;strong&gt;Create API Key&lt;/strong&gt;をクリックします。&lt;/li&gt;
&lt;li&gt;ワークスペースを選択し、チャット補完サービスへのアクセスを許可します。&lt;/li&gt;
&lt;li&gt;APIキーをコピーします。形式は&lt;code&gt;bce-v3/ALTAK-xxxx/xxxx&lt;/code&gt;のようになります。&lt;/li&gt;
&lt;li&gt;キーはソースコードに直書きせず、環境変数に保存します。
&lt;/li&gt;
&lt;/ol&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;&lt;span class="nb"&gt;export &lt;/span&gt;&lt;span class="nv"&gt;QIANFAN_API_KEY&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="s2"&gt;"bce-v3/ALTAK-xxxx/xxxx"&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;実装前に確認すべき点は2つあります。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;新しいv2エンドポイントは単一のBearerトークンを使います。古いv1 OAuth &lt;code&gt;access_token&lt;/code&gt;フローは非推奨なので、新規実装では使わないでください。&lt;/li&gt;
&lt;li&gt;ERNIE 5.1はリリース初日から有料モデルです。最初のリクエスト前に少額の残高をチャージしてください。テスト用途なら¥10程度で十分です。&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  ステップ2：OpenAI互換エンドポイントをcurlで叩く
&lt;/h2&gt;

&lt;p&gt;QianfanはOpenAI互換のチャット補完エンドポイントを提供しています。既存のOpenAI形式のクライアントやラッパーがある場合、多くはベースURLとモデルIDの変更だけで動きます。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;ベースURL:&lt;/strong&gt; &lt;code&gt;https://qianfan.baidubce.com/v2&lt;/code&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;モデルID:&lt;/strong&gt; &lt;code&gt;ernie-5.1&lt;/code&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;早期アクセス機能:&lt;/strong&gt; &lt;code&gt;ernie-5.1-preview&lt;/code&gt;も利用可能&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;最小構成のリクエストは次のとおりです。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;curl https://qianfan.baidubce.com/v2/chat/completions &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;-H&lt;/span&gt; &lt;span class="s2"&gt;"Authorization: Bearer &lt;/span&gt;&lt;span class="nv"&gt;$QIANFAN_API_KEY&lt;/span&gt;&lt;span class="s2"&gt;"&lt;/span&gt; &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;-H&lt;/span&gt; &lt;span class="s2"&gt;"Content-Type: application/json"&lt;/span&gt; &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;-d&lt;/span&gt; &lt;span class="s1"&gt;'{
    "model": "ernie-5.1",
    "messages": [
      {"role": "system", "content": "You are a senior API designer."},
      {"role": "user", "content": "Sketch a REST schema for a GitHub-style PR review API. Be concise."}
    ],
    "temperature": 0.3
  }'&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;レスポンスは標準的なOpenAI形式です。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight json"&gt;&lt;code&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"id"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"chatcmpl-..."&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"object"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"chat.completion"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"created"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="mi"&gt;1746780000&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"model"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"ernie-5.1"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"choices"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"index"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="mi"&gt;0&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"message"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nl"&gt;"role"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"assistant"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nl"&gt;"content"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"..."&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"finish_reason"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"stop"&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"usage"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"prompt_tokens"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="mi"&gt;42&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"completion_tokens"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="mi"&gt;318&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"total_tokens"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="mi"&gt;360&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;エラー時は、まず次を確認してください。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;code&gt;401 Unauthorized&lt;/code&gt;: APIキーが誤っている、または期限切れです。キーを再生成してください。&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;403&lt;/code&gt;: キーは有効ですが、ワークスペースでERNIE 5.1が有効化されていません。Qianfanコンソールでモデル許可を追加してください。&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  ステップ3：PythonからERNIE 5.1を呼び出す
&lt;/h2&gt;

&lt;p&gt;OpenAI互換エンドポイントなので、公式の&lt;code&gt;openai&lt;/code&gt; Python SDKをそのまま使えます。&lt;code&gt;base_url&lt;/code&gt;をQianfanに向けるだけです。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight python"&gt;&lt;code&gt;&lt;span class="kn"&gt;import&lt;/span&gt; &lt;span class="n"&gt;os&lt;/span&gt;
&lt;span class="kn"&gt;from&lt;/span&gt; &lt;span class="n"&gt;openai&lt;/span&gt; &lt;span class="kn"&gt;import&lt;/span&gt; &lt;span class="n"&gt;OpenAI&lt;/span&gt;

&lt;span class="n"&gt;client&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="nc"&gt;OpenAI&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="n"&gt;api_key&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="n"&gt;os&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;environ&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;QIANFAN_API_KEY&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt;
    &lt;span class="n"&gt;base_url&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;https://qianfan.baidubce.com/v2&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="n"&gt;response&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;client&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;chat&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;completions&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;create&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="n"&gt;model&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;ernie-5.1&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;messages&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;
        &lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;role&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;system&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;content&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;You explain APIs in plain English.&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;
        &lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;role&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;user&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;content&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;Why would I use server-sent events over WebSockets for a chat UI?&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;
    &lt;span class="p"&gt;],&lt;/span&gt;
    &lt;span class="n"&gt;temperature&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="mf"&gt;0.4&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="nf"&gt;print&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;response&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;choices&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="mi"&gt;0&lt;/span&gt;&lt;span class="p"&gt;].&lt;/span&gt;&lt;span class="n"&gt;message&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;content&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;span class="nf"&gt;print&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="sa"&gt;f&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="se"&gt;\n&lt;/span&gt;&lt;span class="s"&gt;Tokens used: &lt;/span&gt;&lt;span class="si"&gt;{&lt;/span&gt;&lt;span class="n"&gt;response&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;usage&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;total_tokens&lt;/span&gt;&lt;span class="si"&gt;}&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;既存コードでOpenAI SDKのラッパーを使っている場合、A/Bテスト用にERNIE 5.1へ切り替える変更は最小限で済みます。&lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeekのAPI&lt;/a&gt;や他の多くの中国系モデルプロバイダーでも、同じアプローチが使えます。&lt;/p&gt;

&lt;h2&gt;
  
  
  ステップ4：チャットUI向けにトークンをストリーミングする
&lt;/h2&gt;

&lt;p&gt;ユーザー向けチャットUIでは、レスポンス全体を待つよりもストリーミング表示が適しています。&lt;code&gt;stream: true&lt;/code&gt;を指定し、Server-Sent Eventsを消費します。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight python"&gt;&lt;code&gt;&lt;span class="n"&gt;stream&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;client&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;chat&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;completions&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;create&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="n"&gt;model&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;ernie-5.1&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;messages&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;[{&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;role&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;user&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;content&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;Write a haiku about API versioning.&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;}],&lt;/span&gt;
    &lt;span class="n"&gt;stream&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="bp"&gt;True&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="k"&gt;for&lt;/span&gt; &lt;span class="n"&gt;chunk&lt;/span&gt; &lt;span class="ow"&gt;in&lt;/span&gt; &lt;span class="n"&gt;stream&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;
    &lt;span class="n"&gt;delta&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;chunk&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;choices&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="mi"&gt;0&lt;/span&gt;&lt;span class="p"&gt;].&lt;/span&gt;&lt;span class="n"&gt;delta&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;content&lt;/span&gt;
    &lt;span class="k"&gt;if&lt;/span&gt; &lt;span class="n"&gt;delta&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;
        &lt;span class="nf"&gt;print&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;delta&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;end&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;""&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;flush&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="bp"&gt;True&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;code&gt;curl&lt;/code&gt;でデバッグする場合は、&lt;code&gt;--no-buffer&lt;/code&gt;を付けます。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;curl https://qianfan.baidubce.com/v2/chat/completions &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;-H&lt;/span&gt; &lt;span class="s2"&gt;"Authorization: Bearer &lt;/span&gt;&lt;span class="nv"&gt;$QIANFAN_API_KEY&lt;/span&gt;&lt;span class="s2"&gt;"&lt;/span&gt; &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;-H&lt;/span&gt; &lt;span class="s2"&gt;"Content-Type: application/json"&lt;/span&gt; &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;-d&lt;/span&gt; &lt;span class="s1"&gt;'{
    "model": "ernie-5.1",
    "stream": true,
    "messages": [{"role": "user", "content": "Stream a 3-sentence joke."}]
  }'&lt;/span&gt; &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--no-buffer&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;ストリーム形式はOpenAIと同じです。&lt;code&gt;data: {...}&lt;/code&gt;の行が連続し、最後に&lt;code&gt;data: [DONE]&lt;/code&gt;が返ります。&lt;/p&gt;

&lt;h2&gt;
  
  
  ステップ5：ツールでERNIE 5.1を使う（エージェント機能）
&lt;/h2&gt;

&lt;p&gt;ERNIE 5.1は、τ³-benchとSpreadsheetBench-VerifiedでDeepSeek-V4-Proを上回るスコアを記録しています。つまり、ツール呼び出しはデモ用途だけでなく、本番向けエージェント設計でも検討対象になります。&lt;/p&gt;

&lt;p&gt;ツール定義のスキーマはOpenAIの関数呼び出しと同じです。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight python"&gt;&lt;code&gt;&lt;span class="n"&gt;tools&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="p"&gt;[&lt;/span&gt;
    &lt;span class="p"&gt;{&lt;/span&gt;
        &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;type&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;function&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
        &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;function&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
            &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;name&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;get_weather&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
            &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;description&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;Get current weather for a city.&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
            &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;parameters&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
                &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;type&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;object&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
                &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;properties&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
                    &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;city&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;type&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;string&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;description&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;City name, e.g. Singapore&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;
                    &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;unit&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;type&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;string&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;enum&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;celsius&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;fahrenheit&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;]},&lt;/span&gt;
                &lt;span class="p"&gt;},&lt;/span&gt;
                &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;required&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;city&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt;
            &lt;span class="p"&gt;},&lt;/span&gt;
        &lt;span class="p"&gt;},&lt;/span&gt;
    &lt;span class="p"&gt;}&lt;/span&gt;
&lt;span class="p"&gt;]&lt;/span&gt;

&lt;span class="n"&gt;response&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;client&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;chat&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;completions&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;create&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="n"&gt;model&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;ernie-5.1&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;messages&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;[{&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;role&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;user&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;content&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;What&lt;/span&gt;&lt;span class="sh"&gt;'&lt;/span&gt;&lt;span class="s"&gt;s the weather in Tokyo right now?&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;}],&lt;/span&gt;
    &lt;span class="n"&gt;tools&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="n"&gt;tools&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;tool_choice&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;auto&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="n"&gt;tool_calls&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;response&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;choices&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="mi"&gt;0&lt;/span&gt;&lt;span class="p"&gt;].&lt;/span&gt;&lt;span class="n"&gt;message&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;tool_calls&lt;/span&gt;
&lt;span class="k"&gt;if&lt;/span&gt; &lt;span class="n"&gt;tool_calls&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;
    &lt;span class="n"&gt;call&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;tool_calls&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="mi"&gt;0&lt;/span&gt;&lt;span class="p"&gt;]&lt;/span&gt;
    &lt;span class="nf"&gt;print&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="sa"&gt;f&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;Model wants to call: &lt;/span&gt;&lt;span class="si"&gt;{&lt;/span&gt;&lt;span class="n"&gt;call&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;function&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;name&lt;/span&gt;&lt;span class="si"&gt;}&lt;/span&gt;&lt;span class="s"&gt;(&lt;/span&gt;&lt;span class="si"&gt;{&lt;/span&gt;&lt;span class="n"&gt;call&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;function&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;arguments&lt;/span&gt;&lt;span class="si"&gt;}&lt;/span&gt;&lt;span class="s"&gt;)&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;実装時の基本ループは次の流れです。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;ユーザー入力とツール定義をモデルに渡す。&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;tool_calls&lt;/code&gt;が返ったら、アプリケーション側で実際のツールを実行する。&lt;/li&gt;
&lt;li&gt;実行結果を&lt;code&gt;tool&lt;/code&gt;ロールのメッセージとして会話履歴に追加する。&lt;/li&gt;
&lt;li&gt;再度モデルを呼び出す。&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;finish_reason == "stop"&lt;/code&gt;かつ&lt;code&gt;tool_calls&lt;/code&gt;が空なら終了する。&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;注意点として、ERNIE 5.1はツール引数を常にクリーンなJSON文字列として返すとは限りません。文字列化されたJSONがコードフェンス内に入って返る場合があります。&lt;code&gt;json.loads()&lt;/code&gt;は&lt;code&gt;try/except&lt;/code&gt;でラップし、失敗した場合は&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;
## ステップ6：Node.jsからERNIE 5.1を呼び出す

`openai` v5+を使っているNode.jsプロジェクトなら、同じように`baseURL`をQianfanへ向けます。

&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;

&lt;p&gt;&lt;br&gt;
javascript&lt;br&gt;
import OpenAI from "openai";&lt;/p&gt;

&lt;p&gt;const client = new OpenAI({&lt;br&gt;
  apiKey: process.env.QIANFAN_API_KEY,&lt;br&gt;
  baseURL: "&lt;a href="https://qianfan.baidubce.com/v2" rel="noopener noreferrer"&gt;https://qianfan.baidubce.com/v2&lt;/a&gt;",&lt;br&gt;
});&lt;/p&gt;

&lt;p&gt;const completion = await client.chat.completions.create({&lt;br&gt;
  model: "ernie-5.1",&lt;br&gt;
  messages: [&lt;br&gt;
    { role: "user", content: "Return a JSON object with 3 API design tips." },&lt;br&gt;
  ],&lt;br&gt;
  response_format: { type: "json_object" },&lt;br&gt;
});&lt;/p&gt;

&lt;p&gt;console.log(completion.choices[0].message.content);&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;
`response_format: { type: "json_object" }`は利用できます。ただし、厳密なJSONスキーマ指定（`json_schema`）はQianfanでまだ展開中です。スキーマ制約をモデル側に完全に任せず、アプリケーション側でもレスポンス形式を検証してください。

## ステップ7：Apidogでテストと比較を行う

ERNIE 5.1、DeepSeek V4、Kimi K2.6のどれを使うか比較するなら、ターミナルで個別に`curl`するより、[Apidog](https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation)で同じ条件のリクエストを管理する方が再現性を確保しやすくなります。

推奨構成は次のとおりです。

1. Apidogを開き、「LLM bake-off」という新しいプロジェクトを作成します。

&amp;lt;figure class="kg-card kg-image-card"&amp;gt;&amp;lt;img src="https://assets.apidog.com/blog-next/2026/05/image-81.png" class="kg-image" alt="" loading="lazy" width="2784" height="1824"&amp;gt;&amp;lt;/figure&amp;gt;

2. 環境変数として、次を追加します。

&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;

&lt;p&gt;&lt;br&gt;
text&lt;br&gt;
QIANFAN_API_KEY&lt;br&gt;
DEEPSEEK_API_KEY&lt;br&gt;
MOONSHOT_API_KEY&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;
&amp;lt;figure class="kg-card kg-image-card"&amp;gt;&amp;lt;img src="https://assets.apidog.com/blog-next/2026/05/image-82.png" class="kg-image" alt="" loading="lazy" width="2784" height="1824"&amp;gt;&amp;lt;/figure&amp;gt;

3. プロバイダーごとにリクエストを作成します。
   - Qianfan: `model`を`ernie-5.1`に設定
   - DeepSeek: `model`を`deepseek-chat`に設定
   - Moonshot/Kimi: `model`を`kimi-k2-6`に設定
4. 3つのリクエストで同じ`messages`配列を使います。
5. Apidogの「Run」機能で並行実行し、出力を比較します。

無料枠でもこの比較は扱いやすいです。[Apidog](https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation)は環境ごとにリクエスト履歴を保存するため、後日同じ評価を新しいモデルバージョンに対して再実行できます。tmuxペインで複数の`curl`を監視するより、比較結果を残しやすくなります。

マルチプロバイダーテストの詳細は、[Test local LLMs as APIs](http://apidog.com/blog/test-local-llms-as-apis?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation)と[GLM 5.1 APIガイド](http://apidog.com/blog/how-to-use-glm-5-1-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation)も参考にしてください。

## 料金、レート制限、クォータ

ERNIE 5.1のQianfan公開料金は、リリース投稿には記載されていません。社内資料や見積もりで数値を使う前に、必ずライブコンソールの料金表を確認してください。

実装時は、少なくとも次の3点を考慮します。

- **デフォルトのレート制限はワークスペース単位です。** 新規アカウントは低いQPS制限から始まります。テスト完了後、本番投入前にコンソールから引き上げを申請してください。
- **トークン使用量はレスポンスに含まれます。** `usage`フィールドに`prompt_tokens`、`completion_tokens`、`total_tokens`が入ります。コスト把握のため、リクエストごとにログへ記録してください。
- **キャッシュは自動ではありません。** Anthropicとは異なり、Qianfanは現時点でERNIE 5.1向けのプロンプトキャッシュプリミティブを公開していません。2,000トークンのシステムプロンプトを毎回送る場合、その分のコストが毎回発生します。

## エラー処理を実装する

実際に遭遇しやすいエラーは次のとおりです。

&amp;lt;table&amp;gt;
&amp;lt;thead&amp;gt;
&amp;lt;tr&amp;gt;
&amp;lt;th&amp;gt;ステータス&amp;lt;/th&amp;gt;
&amp;lt;th&amp;gt;意味&amp;lt;/th&amp;gt;
&amp;lt;th&amp;gt;解決策&amp;lt;/th&amp;gt;
&amp;lt;/tr&amp;gt;
&amp;lt;/thead&amp;gt;
&amp;lt;tbody&amp;gt;
&amp;lt;tr&amp;gt;
&amp;lt;td&amp;gt;401&amp;lt;/td&amp;gt;
&amp;lt;td&amp;gt;Bearerトークンが不正または期限切れ&amp;lt;/td&amp;gt;
&amp;lt;td&amp;gt;コンソールから再生成&amp;lt;/td&amp;gt;
&amp;lt;/tr&amp;gt;
&amp;lt;tr&amp;gt;
&amp;lt;td&amp;gt;403&amp;lt;/td&amp;gt;
&amp;lt;td&amp;gt;このワークスペースでモデルが有効になっていない&amp;lt;/td&amp;gt;
&amp;lt;td&amp;gt;コンソールでERNIE 5.1を追加&amp;lt;/td&amp;gt;
&amp;lt;/tr&amp;gt;
&amp;lt;tr&amp;gt;
&amp;lt;td&amp;gt;429&amp;lt;/td&amp;gt;
&amp;lt;td&amp;gt;レート制限に達した&amp;lt;/td&amp;gt;
&amp;lt;td&amp;gt;バックオフ + ジッター付きリトライ&amp;lt;/td&amp;gt;
&amp;lt;/tr&amp;gt;
&amp;lt;tr&amp;gt;
&amp;lt;td&amp;gt;400 (&amp;lt;code&amp;gt;invalid messages&amp;lt;/code&amp;gt;)&amp;lt;/td&amp;gt;
&amp;lt;td&amp;gt;メッセージロールの順序が不正&amp;lt;/td&amp;gt;
&amp;lt;td&amp;gt;ユーザー/アシスタントの交互表示を確認&amp;lt;/td&amp;gt;
&amp;lt;/tr&amp;gt;
&amp;lt;tr&amp;gt;
&amp;lt;td&amp;gt;500/502&amp;lt;/td&amp;gt;
&amp;lt;td&amp;gt;Qianfan側の一時的な問題&amp;lt;/td&amp;gt;
&amp;lt;td&amp;gt;一度リトライ。継続する場合はステータスページを確認&amp;lt;/td&amp;gt;
&amp;lt;/tr&amp;gt;
&amp;lt;/tbody&amp;gt;
&amp;lt;/table&amp;gt;

すべてのAPI呼び出しは、指数バックオフ付きのリトライでラップしてください。上限は3回程度が実用的です。本番環境では、レスポンスヘッダーの`request_id`もログに残してください。Baiduサポートに問い合わせる際、調査に必要になります。

## 最小限の本番向けラッパー

今日ERNIE 5.1をアプリケーションに組み込むなら、まずは次のような薄いラッパーを用意します。

&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;

&lt;p&gt;&lt;br&gt;
python&lt;br&gt;
import os, time, random, json&lt;br&gt;
from openai import OpenAI, RateLimitError, APIError&lt;/p&gt;

&lt;p&gt;client = OpenAI(&lt;br&gt;
    api_key=os.environ["QIANFAN_API_KEY"],&lt;br&gt;
    base_url="&lt;a href="https://qianfan.baidubce.com/v2" rel="noopener noreferrer"&gt;https://qianfan.baidubce.com/v2&lt;/a&gt;",&lt;br&gt;
)&lt;/p&gt;

&lt;p&gt;def chat(messages, &lt;em&gt;, model="ernie-5.1", temperature=0.3, max_retries=3):&lt;br&gt;
    for attempt in range(max_retries):&lt;br&gt;
        try:&lt;br&gt;
            return client.chat.completions.create(&lt;br&gt;
                model=model,&lt;br&gt;
                messages=messages,&lt;br&gt;
                temperature=temperature,&lt;br&gt;
            )&lt;br&gt;
        except RateLimitError:&lt;br&gt;
            time.sleep((2 *&lt;/em&gt; attempt) + random.random())&lt;br&gt;
        except APIError as e:&lt;br&gt;
            if e.status_code and e.status_code &amp;gt;= 500 and attempt &amp;lt; max_retries - 1:&lt;br&gt;
                time.sleep(1 + attempt)&lt;br&gt;
                continue&lt;br&gt;
            raise&lt;br&gt;
    raise RuntimeError("ERNIE 5.1 retries exhausted")&lt;/p&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;


このラッパーで、同期的なチャット補完の多くはカバーできます。ツールループやストリーミングは、この上に追加してください。

## よくある質問

**ERNIE 5.1 APIは無料ですか？**  
いいえ。Qianfanは従量課金制です。永続的な無料枠はありません。新規アカウントには試用クレジットが付与される場合があります。無料で試したい場合は、[ernie.baidu.com](https://ernie.baidu.com)のチャットUI、または[無料LLMの選択肢](http://apidog.com/blog/free-llm-openclaw-web-search?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation)を検討してください。

**ERNIE 5.1をローカルで実行できますか？**  
いいえ。公開されている重みはありません。オンプレミス実行が必須の場合は、代わりに[DeepSeek V4をローカルで実行する方法](http://apidog.com/blog/how-to-run-deepseek-v4-locally?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation)または[2026年の最高のローカルLLM](http://apidog.com/blog/best-local-llms-2026?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation)を参照してください。

**OpenAI SDKは変更なしで動作しますか？**  
はい。`base_url`を`https://qianfan.baidubce.com/v2`に、`api_key`をQianfanキーに設定すれば動作します。ただし、`model`フィールドにはOpenAIのモデルIDではなく、QianfanのモデルIDを指定します。関数呼び出し、ストリーミング、`response_format: json_object`は利用できます。厳密な`json_schema`検証はまだ展開中です。

**ERNIE 5.1は中国語と英語のプロンプトをどのように扱いますか？**  
どちらも第一級の扱いです。Arena Searchスコア1,223は、混合言語の投票者プールから得られました。技術的な英語タスク、たとえばコードやAPI設計ではクローズドな最先端モデルと競合し、中国語のクリエイティブライティングでは中国モデルの中でも最高クラスです。

**最大出力長はどのくらいですか？**  
公式には公開されていません。実運用では、シングルターン応答はモデルが完了するまでに約8Kトークンで上限に達します。長文生成では、タスクを分割して続行する設計にしてください。

ERNIE 5.1でエージェントを構築する場合は、[Apidogをダウンロード](https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation)し、OpenAI互換のリクエストコレクションを使って、Qianfanエンドポイントを他のサービスと一緒にモック、テスト、ドキュメント化してください。

&amp;lt;div style="position: relative; width: 100%; padding-top: 56.25%;"&amp;gt;
        &amp;lt;iframe src="https://www.youtube.com/embed/UMl4Vo_RwkU?si=NcqL2Sz2ckCxX4iX" title="Apidogで公開APIドキュメントを生成する方法" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" allowfullscreen="" style="position: absolute; top: 0; left: 0; width: 100%; height: 100%;"&amp;gt;
        &amp;lt;/iframe&amp;gt;
    &amp;lt;/div&amp;gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;

</description>
    </item>
    <item>
      <title>ERNIE 5.1とは？百度の新しいMoEモデル</title>
      <dc:creator>Akira</dc:creator>
      <pubDate>Thu, 14 May 2026 07:12:55 +0000</pubDate>
      <link>https://dev.to/aakira/ernie-51tohabai-du-noxin-siimoemoderu-3609</link>
      <guid>https://dev.to/aakira/ernie-51tohabai-du-noxin-siimoemoderu-3609</guid>
      <description>&lt;p&gt;Baiduは2026年5月9日に&lt;a href="https://ernie.baidu.com/blog/posts/ernie-5.1-0508-release/" rel="noopener noreferrer"&gt;ERNIE 5.1&lt;/a&gt;をリリースしました。ERNIE 5.1は、ERNIE 5.0の総パラメータの約3分の1のMixture-of-Expertsモデルで、Arena Searchリーダーボードでは&lt;strong&gt;世界第4位&lt;/strong&gt;、中国モデルでは1,223点で1位を獲得しています。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;今すぐApidogを試す&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;このリリースで重要なのは、BaiduがGemini 3.1 ProやDeepSeek-V4-Proに対して、中国語タスクだけでなく、エージェント的なツール使用、長文のクリエイティブライティング、推論能力でも競争する姿勢を明確にした点です。&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;でLLM APIを比較・検証している開発者にとって、700億パラメータ級のフットプリントなしにエージェントスタックへ組み込める中国発のフロンティアモデルとして、ERNIE 5.1は評価対象に入ります。&lt;/p&gt;

&lt;p&gt;この記事では、ERNIE 5.1の概要、アーキテクチャ上の変更点、DeepSeek-V4-ProおよびGemini 3.1 Proとのベンチマーク比較、そして本番環境で&lt;a href="http://apidog.com/blog/what-is-deepseek-v4?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeek V4&lt;/a&gt;や&lt;a href="http://apidog.com/blog/what-is-kimi-k2-6?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Kimi K2.6&lt;/a&gt;を使っている場合の判断ポイントを整理します。&lt;/p&gt;

&lt;h2&gt;
  
  
  要約: ERNIE 5.1を1パラグラフで
&lt;/h2&gt;

&lt;p&gt;ERNIE 5.1は、比較可能なフロンティアモデルの事前学習コストの約6%で学習されたテキスト専用MoEモデルです。総パラメータ数はERNIE 5.0の約3分の1、フォワードパスあたりのアクティブパラメータは約半分です。Arena Searchリーダーボードでは1,223点（世界4位、中国1位）を獲得し、τ³-benchおよびSpreadsheetBench-VerifiedのエージェントベンチマークではDeepSeek-V4-Proを上回ったとされています。ツール使用時のAIME26では99.6点を達成しています。アクセス方法は&lt;a href="https://ernie.baidu.com" rel="noopener noreferrer"&gt;ERNIEチャットUI&lt;/a&gt;、Baidu AI StudioのERNIE 5.1 Playground、Qianfan APIです。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Ft5jq1iuff0zsq0biwn4s.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Ft5jq1iuff0zsq0biwn4s.png" alt="ERNIE 5.1" width="800" height="800"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  このリリースが重要な理由
&lt;/h2&gt;

&lt;p&gt;ERNIE 5.1を見るときは、単に「Baiduの新モデル」としてではなく、以下の3点を確認するのが実用的です。&lt;/p&gt;

&lt;h3&gt;
  
  
  1. 事前学習コスト
&lt;/h3&gt;

&lt;p&gt;Baiduは、ERNIE 5.1の事前学習コストが比較可能なモデルの約6%だとしています。これがQianfan APIの価格に反映される場合、中国クラウド上でLLMを使う開発者にとって、推論コストの比較軸が変わります。&lt;/p&gt;

&lt;p&gt;実装前に確認すべき項目は以下です。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;入力トークン単価&lt;/li&gt;
&lt;li&gt;出力トークン単価&lt;/li&gt;
&lt;li&gt;レート制限&lt;/li&gt;
&lt;li&gt;同時実行数&lt;/li&gt;
&lt;li&gt;エンタープライズ契約時のデータ保持ポリシー&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  2. 3軸MoEルーティング
&lt;/h3&gt;

&lt;p&gt;Baiduは、ERNIE 5.1が&lt;strong&gt;深さ、幅、疎性&lt;/strong&gt;に対して柔軟にルーティングすると説明しています。&lt;/p&gt;

&lt;p&gt;一般的なMoEモデルでは、主に「どのエキスパートを使うか」という幅方向のルーティングが中心です。ERNIE 5.1では、Baiduの説明上、深さと疎性も制御対象に含まれています。&lt;/p&gt;

&lt;p&gt;開発者視点では、次の観点で評価してください。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;レイテンシが安定しているか&lt;/li&gt;
&lt;li&gt;長い会話で品質が落ちにくいか&lt;/li&gt;
&lt;li&gt;ツール呼び出し時に不要なステップが増えないか&lt;/li&gt;
&lt;li&gt;同じプロンプトで出力のばらつきが許容範囲か&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  3. エージェント機能が中心
&lt;/h3&gt;

&lt;p&gt;ERNIE 5.0は知識とクリエイティブライティングの印象が強いモデルでした。一方、ERNIE 5.1では「世界トップモデルと同等のエージェント機能」が前面に出ています。&lt;/p&gt;

&lt;p&gt;特に確認すべきユースケースは以下です。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;検索結果を使った回答生成&lt;/li&gt;
&lt;li&gt;関数呼び出し&lt;/li&gt;
&lt;li&gt;表計算タスク&lt;/li&gt;
&lt;li&gt;コードインタープリタ連携&lt;/li&gt;
&lt;li&gt;複数ターンにまたがるツール選択&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fvvfnkwxbbjjsg40iam9b.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fvvfnkwxbbjjsg40iam9b.png" alt="ERNIE 5.1 benchmark" width="800" height="556"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  ベンチマークの比較
&lt;/h2&gt;

&lt;p&gt;Baiduが公開した内容を、近い比較対象と並べると以下のようになります。&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;ベンチマーク&lt;/th&gt;
&lt;th&gt;ERNIE 5.1&lt;/th&gt;
&lt;th&gt;テスト内容&lt;/th&gt;
&lt;th&gt;比較対象&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;Arena Search リーダーボード&lt;/td&gt;
&lt;td&gt;
&lt;strong&gt;1,223&lt;/strong&gt;（世界4位、中国1位）&lt;/td&gt;
&lt;td&gt;人間評価による検索対応QA&lt;/td&gt;
&lt;td&gt;Gemini 3.1 Pro, GPT-5.x&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;τ³-bench&lt;/td&gt;
&lt;td&gt;DeepSeek-V4-Proを上回る&lt;/td&gt;
&lt;td&gt;エージェント的なツール使用、多ターン&lt;/td&gt;
&lt;td&gt;&lt;a href="http://apidog.com/blog/what-is-deepseek-v4?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeek-V4-Pro&lt;/a&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;SpreadsheetBench-Verified&lt;/td&gt;
&lt;td&gt;DeepSeek-V4-Proを上回る&lt;/td&gt;
&lt;td&gt;実世界の表計算タスク&lt;/td&gt;
&lt;td&gt;DeepSeek-V4-Pro&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;AIME26（ツール使用時）&lt;/td&gt;
&lt;td&gt;&lt;strong&gt;99.6&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;コードインタープリタによる競技数学&lt;/td&gt;
&lt;td&gt;GPT-5.x, Gemini 3.1 Pro&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;GPQA&lt;/td&gt;
&lt;td&gt;「主要なクローズドソースに匹敵」&lt;/td&gt;
&lt;td&gt;大学院レベルの科学QA&lt;/td&gt;
&lt;td&gt;Claude Sonnet 4.6&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;MMLU-Pro&lt;/td&gt;
&lt;td&gt;「主要なクローズドソースに匹敵」&lt;/td&gt;
&lt;td&gt;幅広い知識&lt;/td&gt;
&lt;td&gt;フロンティアモデル全般&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;注意点もあります。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Arenaのスコアは、プロンプトの構成と評価者プールに依存します。&lt;/li&gt;
&lt;li&gt;中国語に偏ったプロンプトが有利に働く可能性があります。&lt;/li&gt;
&lt;li&gt;AIME26の99.6点はツール使用時のスコアです。&lt;/li&gt;
&lt;li&gt;ツールなしの純粋推論によるAIMEスコアは公開されていません。&lt;/li&gt;
&lt;li&gt;クリエイティブライティングでは、Gemini 3.1 Proに「匹敵する」ではなく、「近づいている」という表現にとどまっています。&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;一方で、τ³-benchとSpreadsheetBench-Verifiedの結果は実装上重要です。どちらもエージェント的な能力を測るベンチマークであり、外部で維持され、単純な知識暗記では対応しにくいからです。&lt;/p&gt;

&lt;h2&gt;
  
  
  アーキテクチャについて分かっていること
&lt;/h2&gt;

&lt;p&gt;BaiduはDeepSeekがV3シリーズの論文で開示したほど詳細な仕様を出していません。現時点で確認できる内容は以下です。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;総パラメータ数:&lt;/strong&gt; ERNIE 5.0の約3分の1&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;トークンあたりのアクティブパラメータ数:&lt;/strong&gt; ERNIE 5.0の約半分&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;ルーティング:&lt;/strong&gt; 深さ、幅、疎性に対して柔軟&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;事前学習コスト:&lt;/strong&gt; 比較可能なモデルの約6%&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;モダリティ:&lt;/strong&gt; リリース時点ではテキストのみ&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;言語:&lt;/strong&gt; 中国語版と英語版が利用可能&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;未公開の重要項目は以下です。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;正確な総パラメータ数&lt;/li&gt;
&lt;li&gt;コンテキスト長&lt;/li&gt;
&lt;li&gt;学習トークン数&lt;/li&gt;
&lt;li&gt;推論時の最大出力トークン数&lt;/li&gt;
&lt;li&gt;価格体系の詳細&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;以前に&lt;a href="http://apidog.com/blog/how-to-use-glm-5-1-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;GLM 5.1&lt;/a&gt;のような中国発MoEモデルを使ったことがある場合、Qianfan APIでも類似の開発者体験を想定できます。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fdx2ns3kn75ix6wa9a5m2.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fdx2ns3kn75ix6wa9a5m2.png" alt="ERNIE 5.1 architecture" width="800" height="300"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  ERNIE 5.1でまだできないこと
&lt;/h2&gt;

&lt;p&gt;実装前に、制限事項を明確にしておきます。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;画像入力は非対応。&lt;/strong&gt; ERNIE 5.1はテキスト専用です。画像理解が必要な場合は、ERNIE-VLまたは外部のビジョンモデルを組み合わせる必要があります。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;音声入力・出力は非対応。&lt;/strong&gt; ネイティブな音声機能やリアルタイム音声APIはありません。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;公開されたコンテキストウィンドウは未確認。&lt;/strong&gt; 長文ドキュメント処理では、チャンク化と要約パイプラインを前提に設計してください。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;HuggingFaceの重みはありません。&lt;/strong&gt; ホスト型専用モデルです。オンプレミス要件がある場合は、&lt;a href="http://apidog.com/blog/how-to-run-deepseek-v4-locally?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;ローカルのDeepSeek V4&lt;/a&gt;または&lt;a href="http://apidog.com/blog/best-local-llms-2026?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;ローカルLLM&lt;/a&gt;を検討することになります。&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  ERNIE 5.1と中国のフロンティアモデルの選び方
&lt;/h2&gt;

&lt;p&gt;すでにDeepSeek、Kimi、GLM、Qwenを比較している場合は、以下のように考えると選びやすくなります。&lt;/p&gt;

&lt;h3&gt;
  
  
  ERNIE 5.1を選ぶべきケース
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;中国語または英語で強いエージェント的ツール使用が必要&lt;/li&gt;
&lt;li&gt;検索強化回答を重視する&lt;/li&gt;
&lt;li&gt;中国クラウド上で低コストな推論を期待している&lt;/li&gt;
&lt;li&gt;Qianfan APIを既に使っている、または導入できる&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  &lt;a href="http://apidog.com/blog/use-deepseek-v4?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeek V4&lt;/a&gt;を選ぶべきケース
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;オープンウェイトが必要&lt;/li&gt;
&lt;li&gt;オンプレミス展開が必要&lt;/li&gt;
&lt;li&gt;ツールなしの純粋推論や数学性能を重視する&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  &lt;a href="http://apidog.com/blog/kimi-k2-6-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Kimi K2.6&lt;/a&gt;を選ぶべきケース
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;長いコンテキストウィンドウが必要&lt;/li&gt;
&lt;li&gt;大量ドキュメントを一度に扱う&lt;/li&gt;
&lt;li&gt;契約書、研究資料、ログ解析など長文ワークロードが中心&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  &lt;a href="http://apidog.com/blog/glm-5-1-vs-claude-gpt-gemini-deepseek-llm-comparison?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;GLM 5.1&lt;/a&gt;を選ぶべきケース
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;バランスの取れた汎用モデルが必要&lt;/li&gt;
&lt;li&gt;すでに&lt;a href="http://Z.ai" rel="noopener noreferrer"&gt;Z.ai&lt;/a&gt;またはZhipuをスタックに組み込んでいる&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;これは絶対的なランキングではありません。モデル選定では、公開ベンチマークよりも自社ワークロードでの再現性を優先してください。&lt;/p&gt;

&lt;h2&gt;
  
  
  今すぐERNIE 5.1を試す方法
&lt;/h2&gt;

&lt;p&gt;ERNIE 5.1を試す方法は3つあります。実装に近い順ではなく、摩擦の少ない順に並べると以下です。&lt;/p&gt;

&lt;h3&gt;
  
  
  1. &lt;a href="https://ernie.baidu.com" rel="noopener noreferrer"&gt;ernie.baidu.com&lt;/a&gt;
&lt;/h3&gt;

&lt;p&gt;一般ユーザー向けのチャットUIです。&lt;/p&gt;

&lt;p&gt;向いている用途:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;クリエイティブライティングの確認&lt;/li&gt;
&lt;li&gt;中国語QAの品質確認&lt;/li&gt;
&lt;li&gt;推論傾向の把握&lt;/li&gt;
&lt;li&gt;回答スタイルの確認&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;APIキーは不要です。ただし、本番導入判断にはAPIでの評価が必要です。&lt;/p&gt;

&lt;h3&gt;
  
  
  2. Baidu AI Studio ERNIE 5.1 Playground
&lt;/h3&gt;

&lt;p&gt;Baidu AI Studioには、ERNIE 5.1向けのPlaygroundが用意されています。&lt;/p&gt;

&lt;p&gt;向いている用途:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;ツール呼び出しの確認&lt;/li&gt;
&lt;li&gt;プロンプト調整&lt;/li&gt;
&lt;li&gt;エージェント挙動の観察&lt;/li&gt;
&lt;li&gt;API実装前のPoC&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;まずPlaygroundでプロンプトを固め、その後Qianfan APIへ移すのが効率的です。&lt;/p&gt;

&lt;h3&gt;
  
  
  3. Qianfan API
&lt;/h3&gt;

&lt;p&gt;本番実装ではQianfan APIを使います。&lt;/p&gt;

&lt;p&gt;特徴:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;開発者向けエンドポイント&lt;/li&gt;
&lt;li&gt;Bearerトークン認証&lt;/li&gt;
&lt;li&gt;OpenAI互換に近いリクエスト形式&lt;/li&gt;
&lt;li&gt;API経由でアプリケーションに統合可能&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;詳細な手順は、関連ガイド&lt;a href="http://apidog.com/blog/how-to-use-ernie-5-1-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;ERNIE 5.1 APIの使用方法&lt;/a&gt;で解説されています。&lt;/p&gt;

&lt;p&gt;複数の中国モデルプロバイダーを比較している場合、&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;を使うと、APIキー、リクエストボディ、環境変数、レスポンス比較を1つのワークスペースで管理できます。&lt;/p&gt;

&lt;h2&gt;
  
  
  ApidogでERNIE 5.1を評価する基本フロー
&lt;/h2&gt;

&lt;p&gt;ERNIE 5.1を検証する場合は、単発のcurlではなく、再利用できるAPIコレクションとして管理するのがおすすめです。&lt;/p&gt;

&lt;h3&gt;
  
  
  1. 環境変数を作る
&lt;/h3&gt;

&lt;p&gt;例:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;QIANFAN_API_KEY=your_api_key
QIANFAN_BASE_URL=https://your-qianfan-endpoint
MODEL=ernie-5.1
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h3&gt;
  
  
  2. 共通ヘッダーを設定する
&lt;/h3&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight http"&gt;&lt;code&gt;&lt;span class="err"&gt;Authorization: Bearer {{QIANFAN_API_KEY}}
Content-Type: application/json
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h3&gt;
  
  
  3. 評価用リクエストを作る
&lt;/h3&gt;

&lt;p&gt;以下のようなケースを分けて保存します。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;通常QA&lt;/li&gt;
&lt;li&gt;検索結果を含むQA&lt;/li&gt;
&lt;li&gt;関数呼び出し&lt;/li&gt;
&lt;li&gt;表計算タスク&lt;/li&gt;
&lt;li&gt;数学・推論&lt;/li&gt;
&lt;li&gt;長文要約&lt;/li&gt;
&lt;li&gt;JSON出力&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  4. JSON出力を固定する
&lt;/h3&gt;

&lt;p&gt;アプリケーションで使う場合は、自然文ではなく構造化出力を評価してください。&lt;/p&gt;

&lt;p&gt;例:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight json"&gt;&lt;code&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"task"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"次の問い合わせを分類してください"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"input"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"請求書APIのレスポンスが500になります"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"output_schema"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"category"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"billing | api_error | account | other"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"priority"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"low | medium | high"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"summary"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"string"&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;確認すべき点:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;JSONが壊れないか&lt;/li&gt;
&lt;li&gt;enum以外の値を返さないか&lt;/li&gt;
&lt;li&gt;不明な場合に推測しすぎないか&lt;/li&gt;
&lt;li&gt;日本語・中国語・英語で同じ形式を維持できるか&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  5. 既存モデルと並べて比較する
&lt;/h3&gt;

&lt;p&gt;ERNIE 5.1だけを評価しても意味がありません。現在使っているモデルと同じプロンプトで比較してください。&lt;/p&gt;

&lt;p&gt;最低限見るべき指標:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;正答率&lt;/li&gt;
&lt;li&gt;ツール選択の正確性&lt;/li&gt;
&lt;li&gt;レイテンシ&lt;/li&gt;
&lt;li&gt;トークン使用量&lt;/li&gt;
&lt;li&gt;JSON整合性&lt;/li&gt;
&lt;li&gt;再試行率&lt;/li&gt;
&lt;li&gt;人手修正の必要回数&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  価格と展開
&lt;/h2&gt;

&lt;p&gt;Baiduは、ERNIE 5.1がリリース後数週間のうちに&lt;strong&gt;10以上のクリエイティブ制作プラットフォーム&lt;/strong&gt;へ展開されると発表しています。&lt;/p&gt;

&lt;p&gt;Qianfanでのトークン単価はリリース投稿には記載されていません。Baiduは事前学習コストが約6%だと説明していますが、それがそのままAPI価格になるとは限りません。&lt;/p&gt;

&lt;p&gt;導入前に必ず確認してください。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Qianfanコンソール上の最新価格&lt;/li&gt;
&lt;li&gt;無料枠の有無&lt;/li&gt;
&lt;li&gt;入出力トークン別の単価&lt;/li&gt;
&lt;li&gt;キャッシュやバッチ処理の有無&lt;/li&gt;
&lt;li&gt;SLA&lt;/li&gt;
&lt;li&gt;データ保持設定&lt;/li&gt;
&lt;li&gt;エンタープライズ契約の条件&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;社内向けにコスト試算を出す場合は、公開記事の数字ではなく、Qianfanコンソールの最新価格を基準にしてください。&lt;/p&gt;

&lt;h2&gt;
  
  
  開発者向けの導入判断
&lt;/h2&gt;

&lt;p&gt;ERNIE 5.1を本番スタックに入れるか判断するなら、次の3ステップで進めるのが現実的です。&lt;/p&gt;

&lt;h3&gt;
  
  
  1. 自社タスクで20〜50件の評価セットを作る
&lt;/h3&gt;

&lt;p&gt;公開ベンチマークは参考になりますが、あなたのワークロードそのものではありません。&lt;/p&gt;

&lt;p&gt;評価セットには、実際に失敗しやすいケースを入れてください。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;曖昧な問い合わせ&lt;/li&gt;
&lt;li&gt;不完全な入力&lt;/li&gt;
&lt;li&gt;長い文脈&lt;/li&gt;
&lt;li&gt;ツール呼び出しが必要なケース&lt;/li&gt;
&lt;li&gt;JSON形式を厳守するケース&lt;/li&gt;
&lt;li&gt;誤回答が重大な影響を持つケース&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;a href="http://apidog.com/blog/test-local-llms-as-apis?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;APIとしてのLLMテスト&lt;/a&gt;では、Apidogを使った評価方法が解説されています。&lt;/p&gt;

&lt;h3&gt;
  
  
  2. 中国クラウド利用の可否を確認する
&lt;/h3&gt;

&lt;p&gt;Qianfanは中国でホストされています。データレジデンシー要件で中国インフラが使えない場合、ベンチマークが良くても採用は難しくなります。&lt;/p&gt;

&lt;p&gt;確認すべき項目:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;個人情報を送信できるか&lt;/li&gt;
&lt;li&gt;ログ保持ポリシー&lt;/li&gt;
&lt;li&gt;データの保存場所&lt;/li&gt;
&lt;li&gt;社内セキュリティレビュー&lt;/li&gt;
&lt;li&gt;顧客契約上の制限&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  3. 価格発表を待ってから本番コストを見積もる
&lt;/h3&gt;

&lt;p&gt;ERNIE 5.1で最も注目すべき数字は、事前学習コストが約6%という点です。ただし、API価格がどうなるかは別問題です。&lt;/p&gt;

&lt;p&gt;本番導入前には、以下を使って見積もってください。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;月間コスト =
  月間入力トークン数 × 入力単価
+ 月間出力トークン数 × 出力単価
+ 再試行分の追加コスト
+ 評価・監視用リクエストのコスト
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;エージェント用途では、ツール呼び出しや再試行によってトークン数が増えやすい点にも注意が必要です。&lt;/p&gt;

&lt;h2&gt;
  
  
  よくある質問
&lt;/h2&gt;

&lt;h3&gt;
  
  
  ERNIE 5.1はオープンソースですか？
&lt;/h3&gt;

&lt;p&gt;いいえ。ERNIE 5.1は、BaiduのチャットUI、Baidu AI Studio、Qianfan APIを通じて利用するホスト型専用モデルです。執筆時点では、HuggingFaceに公開されている重みはありません。&lt;/p&gt;

&lt;h3&gt;
  
  
  ERNIE 5.1は画像入力をサポートしていますか？
&lt;/h3&gt;

&lt;p&gt;いいえ。ERNIE 5.1はリリース時点ではテキスト専用です。Baiduの視覚タスクにはERNIE-VLファミリーを使う必要があります。単一のマルチモーダル中国モデルが必要な場合は、&lt;a href="http://apidog.com/blog/how-to-use-qwen-3-5-omni?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Qwen 3.5 Omni&lt;/a&gt;を検討してください。&lt;/p&gt;

&lt;h3&gt;
  
  
  コンテキスト長はどのくらいですか？
&lt;/h3&gt;

&lt;p&gt;Baiduはリリース投稿で具体的なコンテキストウィンドウの数値を公開していません。確認されるまでは、長文ドキュメントを直接投入するのではなく、チャンク化、検索、要約を組み合わせて設計してください。&lt;/p&gt;

&lt;h3&gt;
  
  
  中国外からERNIE 5.1を使えますか？
&lt;/h3&gt;

&lt;p&gt;チャットUIとQianfan APIは多くの地域からアクセス可能ですが、レイテンシ、アカウント認証、エンタープライズ機能の条件は異なります。一部の機能では、中国本土の電話番号または事業許可が必要になる場合があります。アクセス手順は&lt;a href="http://apidog.com/blog/how-to-use-ernie-5-1-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;ERNIE 5.1 APIの使用方法&lt;/a&gt;で詳しく説明されています。&lt;/p&gt;

&lt;h3&gt;
  
  
  ERNIE 5.1はDeepSeek-V4-Proより優れていますか？
&lt;/h3&gt;

&lt;p&gt;τ³-benchとSpreadsheetBench-Verifiedでは、BaiduはERNIE 5.1がDeepSeek-V4-Proを上回るとしています。一方、オープンウェイトやオンプレミス展開ではDeepSeek側に利点があります。ツールを使わない純粋な数学推論では、公開情報だけでは明確な結論は出せません。&lt;/p&gt;

&lt;h2&gt;
  
  
  まとめ
&lt;/h2&gt;

&lt;p&gt;ERNIE 5.1は、Baiduがエージェント用途を明確に意識して投入したテキスト専用MoEモデルです。特に、ツール使用、検索強化回答、表計算タスク、中国語・英語の実用ワークロードで評価する価値があります。&lt;/p&gt;

&lt;p&gt;導入前にやるべきことはシンプルです。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;Qianfan APIでアクセスできるか確認する&lt;/li&gt;
&lt;li&gt;自社タスクの評価セットを20〜50件作る&lt;/li&gt;
&lt;li&gt;既存モデルと同じプロンプトで比較する&lt;/li&gt;
&lt;li&gt;JSON整合性、ツール選択、レイテンシ、コストを測る&lt;/li&gt;
&lt;li&gt;データレジデンシーと価格条件を確認する&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;開発を始める準備ができたら、ApidogでQianfan APIのリクエストを管理し、ERNIE 5.1を現在のモデルと並行して同じワークスペースでテストしてください。&lt;/p&gt;

</description>
    </item>
    <item>
      <title>Apidog Spec-First モード体験：ビジュアルデザイナーだけではない開発の進化</title>
      <dc:creator>Akira</dc:creator>
      <pubDate>Thu, 14 May 2026 07:04:54 +0000</pubDate>
      <link>https://dev.to/aakira/apidog-spec-first-modoti-yan-biziyuarudezainadakedehanaikai-fa-nojin-hua-29mg</link>
      <guid>https://dev.to/aakira/apidog-spec-first-modoti-yan-biziyuarudezainadakedehanaikai-fa-nojin-hua-29mg</guid>
      <description>&lt;p&gt;私がこれまで関わってきたAPIチームには、だいたい2つの運用パターンがありました。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;今すぐApidogを試す&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;1つ目は、OpenAPI仕様を手で書き、&lt;code&gt;specs/&lt;/code&gt; ディレクトリにコミットし、Gitを唯一の信頼できる情報源として扱うチームです。2つ目は、ビジュアルデザイナーで仕様を作り、CIで問題が出たタイミングで仕様をエクスポートし、UI上の定義とリポジトリ上の定義の差分を後から修正するチームです。&lt;/p&gt;

&lt;p&gt;どちらの運用も経験しました。前者は初動が遅い一方で、90日後には速くなります。後者はその逆です。Apidogは長く後者寄りのツールでした。ビジュアルデザイナーは使いやすいものの、YAMLとの往復変換はコードレビューで説明が必要な運用になりがちでした。&lt;/p&gt;

&lt;p&gt;しかし4月中旬、新規プロジェクト作成画面に&lt;a href="https://docs.apidog.com/spec-first-mode-beta-2058268m0?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;スペックファーストモード（ベータ）&lt;/a&gt;が追加されました。ローンチ直後ではなく、実際のサイドプロジェクトのOpenAPI仕様で半日ほど試してから判断しました。この記事では、チームで導入する前に確認すべきポイント、セットアップ手順、向いているケースと向いていないケースを整理します。&lt;/p&gt;

&lt;h2&gt;
  
  
  スペックファーストモードで変わること
&lt;/h2&gt;

&lt;p&gt;Apidogには現在、性質の異なる2つのプロジェクトモードがあります。&lt;/p&gt;

&lt;p&gt;デフォルトの一般モードでは、「+ 新規プロジェクト」からプロジェクトを作成し、フォルダーとフォームベースのUIでエンドポイントを定義します。OpenAPI仕様は内部的に生成されます。YAMLに慣れていないチームや、非エンジニアもAPI定義に関わるチームには引き続き有効です。&lt;/p&gt;

&lt;p&gt;一方、スペックファーストモードでは、中心になるのはフォームではなく、実際の &lt;code&gt;.yaml&lt;/code&gt; / &lt;code&gt;.json&lt;/code&gt; ファイルです。Gitリポジトリとの双方向同期があり、OpenAPI仕様そのものをディスク上のファイルとして扱います。&lt;/p&gt;

&lt;p&gt;主な違いは次の通りです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;code&gt;.yaml&lt;/code&gt; / &lt;code&gt;.json&lt;/code&gt; を直接編集する&lt;/li&gt;
&lt;li&gt;OpenAPIスキーマに基づく補完が使える&lt;/li&gt;
&lt;li&gt;構文ハイライトがある&lt;/li&gt;
&lt;li&gt;入力中にパス一覧がサイドバーへ反映される&lt;/li&gt;
&lt;li&gt;Gitリポジトリと双方向同期できる&lt;/li&gt;
&lt;li&gt;UIは仕様ファイルのラッパーではなく、仕様ファイルを見るためのビューになる&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;特に重要なのは、リアルタイムのアウトライン表示です。YAMLの問題は「難しい」ことよりも、構造が長いファイルの中に埋もれやすいことです。Apidogのスペックファーストモードでは、ファイルを直接編集しながら、左側のアウトラインでエンドポイントを移動できます。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F05%2Fimage-75.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F05%2Fimage-75.png" alt="ペットストアプロジェクトの編集中であるスペックファーストモードのワークスペース。左サイドバーは自動生成されたパスの概要 — 上部にPaths (224)があり、その後、/store/auth/{email}、/admin/auth、/store/tokenのような個々のルートがファイルから直接生成されていることに注目。右上: Changes (1)インジケーターと緑色のCommit &amp;amp; Pushボタン。左下: Synced just now — 後述の同期ステータスインジケーター。" width="800" height="478"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;スペックファースト開発の本質は、テキストエディタが好きかどうかではありません。成果物をどこで管理するかです。スペックファーストモードでは、リポジトリ内のOpenAPIファイルが成果物になります。ApidogのUIは、そのファイルを編集・確認するための作業環境です。&lt;/p&gt;

&lt;h2&gt;
  
  
  セットアップ手順
&lt;/h2&gt;

&lt;p&gt;実際に試したセットアップ手順は次の通りです。Git認証を含めても、10分程度で完了しました。&lt;/p&gt;

&lt;h3&gt;
  
  
  1. スペックファーストモードでプロジェクトを作成する
&lt;/h3&gt;

&lt;p&gt;プロジェクト画面から、次の順に進みます。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;+ 新規プロジェクト
→ 一般
→ スペックファーストモード
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;注意点として、一般モードには「推奨」ラベルが付いています。普段どおりにプロジェクトを作ると、スペックファーストモードのタイルを見落としやすいです。OpenAPIファイルをGit中心で管理したい場合は、必ずスペックファーストモードを選びます。&lt;/p&gt;

&lt;h3&gt;
  
  
  2. Gitリポジトリに接続する
&lt;/h3&gt;

&lt;p&gt;次に、&lt;code&gt;Gitリポジトリと接続&lt;/code&gt; セクションでGitプロバイダーを認証します。&lt;/p&gt;

&lt;p&gt;設定する項目は次の3つです。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;Organization
Repository
Main branch
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;私はGitHubで試しました。選択したブランチ内の &lt;code&gt;.yaml&lt;/code&gt; / &lt;code&gt;.json&lt;/code&gt; ファイルが、Apidog側の作業対象として同期されます。&lt;/p&gt;

&lt;h3&gt;
  
  
  3. プロジェクト名と権限を設定する
&lt;/h3&gt;

&lt;p&gt;続いて、次を設定します。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;Project Name
Team permissions
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;作成すると、初回同期が走り、リポジトリ内のOpenAPI仕様ファイルがApidogのワークスペースに取り込まれます。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F05%2Fimage-76.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F05%2Fimage-76.png" alt="ステップ1〜3は同じダイアログに表示されます。上部: 2つのモードタイル。一般モードには「推奨」のフラグが付いており、スペックファーストモードタイル（右、ベータバッジ、紫色のハイライト）が見逃されやすい理由です。スペックファーストタイルには、その下で変更される内容がリストされています: OpenAPI Spec Editor (Supports Visualization) と Two-way sync with Git repository。下部: Organization、Repository (pet-store)、Main branch (main) のドロップダウンと、Project Nameフィールドがある「Connect with Git Repository」パネル。1つの画面で3つの決定。" width="800" height="459"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h3&gt;
  
  
  4. OpenAPI仕様をファイルとして編集する
&lt;/h3&gt;

&lt;p&gt;同期後、任意のYAMLファイルを開きます。ここでは、フォームではなく実ファイルを編集します。&lt;/p&gt;

&lt;p&gt;たとえば、次のようなOpenAPI定義をそのまま編集できます。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight yaml"&gt;&lt;code&gt;&lt;span class="na"&gt;openapi&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt; &lt;span class="s"&gt;3.0.3&lt;/span&gt;
&lt;span class="na"&gt;info&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt;
  &lt;span class="na"&gt;title&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt; &lt;span class="s"&gt;Pet Store API&lt;/span&gt;
  &lt;span class="na"&gt;version&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt; &lt;span class="s"&gt;1.0.0&lt;/span&gt;

&lt;span class="na"&gt;paths&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt;
  &lt;span class="na"&gt;/pets&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt;
    &lt;span class="na"&gt;get&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt;
      &lt;span class="na"&gt;summary&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt; &lt;span class="s"&gt;List pets&lt;/span&gt;
      &lt;span class="na"&gt;responses&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt;
        &lt;span class="s1"&gt;'&lt;/span&gt;&lt;span class="s"&gt;200'&lt;/span&gt;&lt;span class="err"&gt;:&lt;/span&gt;
          &lt;span class="na"&gt;description&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt; &lt;span class="s"&gt;A list of pets&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;編集中は、OpenAPIスキーマに基づく補完が効きます。さらに、&lt;code&gt;paths&lt;/code&gt; に追加したエンドポイントはサイドバーのアウトラインに反映されます。アウトライン上のエンドポイントをクリックすると、該当する行へ移動できます。&lt;/p&gt;

&lt;p&gt;VS CodeでOpenAPI拡張を使っている人には近い操作感ですが、Apidogではエンドポイント一覧や同期状態も同じ画面で確認できます。&lt;/p&gt;

&lt;h3&gt;
  
  
  5. 変更をコミットしてプッシュする
&lt;/h3&gt;

&lt;p&gt;変更後は、右上の &lt;code&gt;Commit &amp;amp; Push&lt;/code&gt; をクリックします。&lt;/p&gt;

&lt;p&gt;ダイアログには次の要素があります。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;変更されたファイル一覧&lt;/li&gt;
&lt;li&gt;コミットメッセージ入力欄&lt;/li&gt;
&lt;li&gt;&lt;code&gt;Push&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;code&gt;Discard all changes&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;code&gt;Cancel&lt;/code&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;個別にステージングするステップはありません。変更一覧に含まれるものがコミット対象になります。仕様ファイル中心の編集であれば、この簡略化は十分実用的です。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F05%2Fimage-77.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F05%2Fimage-77.png" alt="Gitリポジトリへのプッシュダイアログ。構造に注目: 1つのコミットメッセージフィールド、ファイルごとのチェックボックスがある変更点（1ファイル）リスト、そして下部に3つのボタン — すべての変更を破棄（左、破壊的）、キャンセル（中立）、プッシュ（主要なアクション、紫色）。背景には、このダイアログを開いたワークスペースの右上にあるコミット＆プッシュボタンが見えます。" width="800" height="465"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h3&gt;
  
  
  6. 同期インジケーターを確認する
&lt;/h3&gt;

&lt;p&gt;左下に同期状態が表示されます。&lt;/p&gt;

&lt;p&gt;図では &lt;code&gt;Synced just now&lt;/code&gt; と表示されています。これは、Apidog上の編集内容とリモートリポジトリの状態が一致していることを示します。&lt;/p&gt;

&lt;p&gt;実運用では、次のように確認するとわかりやすいです。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;Synced just now     → 同期済み
Changes available   → リモート側に変更あり
Changes pending     → ローカル側に未プッシュ変更あり
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;インジケーターが緑であれば、Apidogとリポジトリは一致しています。複数人で編集する場合は、この表示を常に確認するのがよさそうです。&lt;/p&gt;

&lt;h2&gt;
  
  
  使ってわかった実装上のポイント
&lt;/h2&gt;

&lt;p&gt;半日使って、特に重要だと感じた点は3つあります。&lt;/p&gt;

&lt;h3&gt;
  
  
  1. アウトラインの更新が速い
&lt;/h3&gt;

&lt;p&gt;過去に使ったライブOpenAPIエディタの多くは、保存時に再解析する仕組みでした。そのため、エンドポイントを追加してからサイドバーに表示されるまでに遅延がありました。&lt;/p&gt;

&lt;p&gt;Apidogのスペックファーストモードでは、入力中にアウトラインが更新されます。ほぼ即時に反映されるため、アウトラインを「確認用」ではなく「ナビゲーション用」として使えます。&lt;/p&gt;

&lt;p&gt;長いOpenAPIファイルを扱う場合、この差は大きいです。&lt;/p&gt;

&lt;h3&gt;
  
  
  2. Git同期は実際に双方向で動く
&lt;/h3&gt;

&lt;p&gt;Apidogを開いたまま、ローカルクローン側で同じ仕様ファイルを編集し、ターミナルからプッシュしてみました。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;git add openapi.yaml
git commit &lt;span class="nt"&gt;-m&lt;/span&gt; &lt;span class="s2"&gt;"Update pet schema"&lt;/span&gt;
git push origin main
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Apidog側ではリモート変更が検知され、同期インジケーターが変化しました。その後、ワンクリックで変更をエディターに取り込めました。&lt;/p&gt;

&lt;p&gt;つまり、チーム内で次のような混在運用ができます。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;一部のメンバーはApidogで編集する&lt;/li&gt;
&lt;li&gt;一部のメンバーはVS CodeやVimで編集する&lt;/li&gt;
&lt;li&gt;どちらも同じGitリポジトリ上のOpenAPIファイルを編集する&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;重要なのは、Apidog内の状態とGit内の状態を別々に管理しなくてよいことです。&lt;/p&gt;

&lt;h3&gt;
  
  
  3. 同じプロジェクト内で一般モードには戻れない
&lt;/h3&gt;

&lt;p&gt;スペックファーストモードで作成したプロジェクトは、スペックファースト用のプロジェクトになります。途中で一般モードのビジュアルデザイナーへ切り替えることはできません。&lt;/p&gt;

&lt;p&gt;これは、内部のデータモデルが異なるためです。&lt;/p&gt;

&lt;p&gt;もし同じ仕様を両方の操作方法で扱いたい場合は、次のような運用になります。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;Gitリポジトリ
├── OpenAPI仕様ファイル
│
├── Apidog スペックファーストプロジェクト
│   └── Git同期で編集
│
└── Apidog 一般モードプロジェクト
    └── 同じ仕様からインポート
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;完全にシームレスではありませんが、Git上の仕様を中心に据えれば運用は可能です。&lt;/p&gt;

&lt;h2&gt;
  
  
  向いているチーム
&lt;/h2&gt;

&lt;p&gt;スペックファーストモードが特に向いているのは、次のようなチームです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;OpenAPI仕様をすでに手書きしている&lt;/li&gt;
&lt;li&gt;OpenAPI仕様をGitでレビューしたい&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;spectral lint&lt;/code&gt; などをCIで実行している&lt;/li&gt;
&lt;li&gt;仕様からSDKや型定義を生成している&lt;/li&gt;
&lt;li&gt;Pull Request上でAPI変更をレビューしたい&lt;/li&gt;
&lt;li&gt;Apidog上の仕様とリポジトリ上の仕様のズレをなくしたい&lt;/li&gt;
&lt;li&gt;エンジニアがVS CodeやVimでも編集できる状態を保ちたい&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;たとえば、CIで次のようなチェックをしている場合には相性がよいです。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight yaml"&gt;&lt;code&gt;&lt;span class="na"&gt;name&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt; &lt;span class="s"&gt;OpenAPI Lint&lt;/span&gt;

&lt;span class="na"&gt;on&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt;
  &lt;span class="na"&gt;pull_request&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt;
    &lt;span class="na"&gt;paths&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt;
      &lt;span class="pi"&gt;-&lt;/span&gt; &lt;span class="s2"&gt;"&lt;/span&gt;&lt;span class="s"&gt;specs/**/*.yaml"&lt;/span&gt;

&lt;span class="na"&gt;jobs&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt;
  &lt;span class="na"&gt;lint&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt;
    &lt;span class="na"&gt;runs-on&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt; &lt;span class="s"&gt;ubuntu-latest&lt;/span&gt;
    &lt;span class="na"&gt;steps&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt;
      &lt;span class="pi"&gt;-&lt;/span&gt; &lt;span class="na"&gt;uses&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt; &lt;span class="s"&gt;actions/checkout@v4&lt;/span&gt;
      &lt;span class="pi"&gt;-&lt;/span&gt; &lt;span class="na"&gt;run&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt; &lt;span class="s"&gt;npm install -g @stoplight/spectral-cli&lt;/span&gt;
      &lt;span class="pi"&gt;-&lt;/span&gt; &lt;span class="na"&gt;run&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt; &lt;span class="s"&gt;spectral lint specs/openapi.yaml&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;この場合、Apidogで編集した仕様も通常のGitフローに乗ります。レビュー、CI、生成処理をすべて同じファイルに対して実行できます。&lt;/p&gt;

&lt;h2&gt;
  
  
  向いていないチーム
&lt;/h2&gt;

&lt;p&gt;一方で、次のようなチームには一般モードのほうが向いています。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;OpenAPIをほとんど書いたことがない&lt;/li&gt;
&lt;li&gt;YAMLを直接編集するメンバーが少ない&lt;/li&gt;
&lt;li&gt;非エンジニアがフォームUIでAPI定義を作る必要がある&lt;/li&gt;
&lt;li&gt;ビジュアルデザイナーが参加の前提になっている&lt;/li&gt;
&lt;li&gt;同じプロジェクト内でフォーム編集とファイル編集を切り替えたい&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;スペックファーストモードは、オンボーディングの簡単さよりも、仕様ファイルの忠実性を優先するモードです。APIスペシャリスト以外のメンバーが多いチームでは、一般モードのほうが導入しやすいです。&lt;/p&gt;

&lt;p&gt;また、同じプロジェクト内で一般モードとスペックファーストモードを混在させたい場合も、現時点では向いていません。この点はベータ版らしい制約です。&lt;/p&gt;

&lt;h2&gt;
  
  
  導入する場合のおすすめワークフロー
&lt;/h2&gt;

&lt;p&gt;チームで試すなら、いきなり全APIを移行するより、1つの仕様ファイルから始めるのが安全です。&lt;/p&gt;

&lt;p&gt;おすすめの流れは次の通りです。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;1. 既存のOpenAPI仕様をGitに置く
2. CIでlintを設定する
3. Apidogでスペックファーストプロジェクトを作成する
4. Gitリポジトリを接続する
5. 小さなエンドポイント変更をApidog上で行う
6. Commit &amp;amp; Pushする
7. Pull RequestとCIで差分を確認する
8. チームメンバーに編集手順を共有する
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;最初に確認すべき観点は次の3つです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Apidog上の編集差分が期待通りGitに出るか&lt;/li&gt;
&lt;li&gt;CIのOpenAPI lintが通るか&lt;/li&gt;
&lt;li&gt;ローカルエディタで編集した変更をApidogが取り込めるか&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;この3点が問題なければ、日常的な仕様編集には十分使えます。&lt;/p&gt;

&lt;h2&gt;
  
  
  まとめ
&lt;/h2&gt;

&lt;p&gt;これまでスペックファースト開発は、APIデザインツールを諦めることとほぼ同義でした。YAMLで作業してGitを信頼する代わりに、モックサーバーやテストランナーとの統合を諦める。あるいは、ビジュアルデザイナーを使う代わりに、Gitを唯一の情報源にすることを諦める。そのどちらかでした。&lt;/p&gt;

&lt;p&gt;Apidogのスペックファーストモードでは、この分断がかなり小さくなっています。&lt;/p&gt;

&lt;p&gt;リポジトリ内のファイルが、エディター内のファイルです。アウトラインは状態ではなくビューです。Git同期はエクスポート機能ではなく、作業フローの一部です。&lt;/p&gt;

&lt;p&gt;新規プロジェクト作成時にスペックファーストモードを選び、既存のGitリポジトリを接続すれば、最初のコミットまでは10分程度で到達できます。継続利用するかどうかは、1週間ほど実際のAPI変更で試せば判断できます。&lt;/p&gt;

</description>
    </item>
    <item>
      <title>ClaudeプランでClaude Agent SDKを使う方法</title>
      <dc:creator>Akira</dc:creator>
      <pubDate>Thu, 14 May 2026 03:55:55 +0000</pubDate>
      <link>https://dev.to/aakira/claudepurandeclaude-agent-sdkwoshi-ufang-fa-4fl8</link>
      <guid>https://dev.to/aakira/claudepurandeclaude-agent-sdkwoshi-ufang-fa-4fl8</guid>
      <description>&lt;p&gt;Anthropicは、2026年6月15日より、既存のClaudeサブスクリプションでClaude Agent SDKを実行できるようにします。これまでAgent SDKで何かを構築するには、Claude ProやMaxとは別に、従量課金制のAPIキーが必要でした。6月15日以降は、毎月のClaudeプランにAgent SDK専用のクレジット残高が含まれます。APIキーは不要です。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;今すぐApidogを試す&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;デプロイボット、リサーチアシスタント、トリアージツールなどのカスタムエージェントを試したいが、プロトタイプのためだけにAnthropicへ別の請求カードを登録したくなかった場合、この変更は実装のハードルを下げます。Proサブスクリプションには月額20ドルのAgent SDK使用クレジット、Max 20xには200ドル、Team Premiumシートには100ドルが含まれます。&lt;/p&gt;

&lt;h2&gt;
  
  
  2026年6月15日に何が変わったのか
&lt;/h2&gt;

&lt;p&gt;Agent SDKの利用料は、Claudeプランに紐づいた月額クレジットから消費されるようになりました。以前は、Anthropic API経由で別途コンソール残高に請求されていました。&lt;/p&gt;

&lt;p&gt;Anthropicの発表に基づくプラン別クレジットは次のとおりです。&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;プラン&lt;/th&gt;
&lt;th&gt;月額Agent SDKクレジット&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;Pro&lt;/td&gt;
&lt;td&gt;20ドル&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Max 5x&lt;/td&gt;
&lt;td&gt;100ドル&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Max 20x&lt;/td&gt;
&lt;td&gt;200ドル&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;チームスタンダード（1シートあたり）&lt;/td&gt;
&lt;td&gt;20ドル&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;チームプレミアム（1シートあたり）&lt;/td&gt;
&lt;td&gt;100ドル&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;エンタープライズ（使用量ベース）&lt;/td&gt;
&lt;td&gt;20ドル&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;エンタープライズプレミアムシート&lt;/td&gt;
&lt;td&gt;200ドル&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;実装前に確認すべきルールは以下です。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;エンタープライズスタンダードシートのメンバーはクレジットを受け取れません。&lt;/strong&gt; APIキーを使用するか、プレミアムシートにアップグレードする必要があります。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;クレジットはユーザーごとに付与され、譲渡できません。&lt;/strong&gt; 自分のシートのクレジットをチームメイトと共有することはできません。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;未使用クレジットは繰り越されません。&lt;/strong&gt; 請求サイクルの終わりに残った分はリセットされます。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;1回限りのオプトインが必要です。&lt;/strong&gt; クレジットは申請するまでアカウントで有効になりません。申請後は毎月自動更新されます。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;APIキーユーザーはこのクレジットを受け取りません。&lt;/strong&gt; &lt;code&gt;ANTHROPIC_API_KEY&lt;/code&gt;で認証している場合は、従来のAPI請求モデルのままです。&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  クレジットでカバーされるもの
&lt;/h2&gt;

&lt;p&gt;Agent SDKクレジットでカバーされるのは、プログラムによる自動化・非対話型ワークロードです。&lt;/p&gt;

&lt;p&gt;対象になるもの：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;PythonまたはTypeScriptプロジェクトからのClaude Agent SDK呼び出し&lt;/li&gt;
&lt;li&gt;Claude Codeの&lt;code&gt;claude -p&lt;/code&gt;コマンド
非対話モードで、スクリプト化されたエージェント実行に使います。&lt;/li&gt;
&lt;li&gt;Claude CodeのGitHub Actions連携&lt;/li&gt;
&lt;li&gt;Agent SDKで認証するサードパーティアプリケーション&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;対象外のもの：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;対話型のClaude Codeセッション&lt;/li&gt;
&lt;li&gt;Claudeウェブアプリまたはモバイルアプリでの会話&lt;/li&gt;
&lt;li&gt;Claude Coworkセッション&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;通常のClaude Code作業は、プランの既存の利用制限の範囲内です。Anthropicはこの制限を&lt;a href="http://apidog.com/blog/claude-code-weekly-limits-50-percent-increase-july-2026?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;最近7月13日まで50%引き上げました&lt;/a&gt;。&lt;/p&gt;

&lt;p&gt;つまり、次の2つは別の予算として扱われます。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;日常的な対話型Claude Code利用&lt;/li&gt;
&lt;li&gt;Agent SDKや&lt;code&gt;claude -p&lt;/code&gt;による自動化&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;この分離により、通常のコーディング用のClaude Code利用枠を消費せずに、SDKベースのカスタムエージェントを試せます。&lt;/p&gt;

&lt;h2&gt;
  
  
  クレジットがなくなった場合
&lt;/h2&gt;

&lt;p&gt;クレジットを使い切った後の挙動は、追加使用の設定で決まります。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;追加使用を有効にする&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
超過分は、プランの支払い方法に対して標準APIレートで従量課金されます。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;追加使用を無効にする&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
請求サイクルがリセットされるまで、リクエストはクレジット上限で停止します。&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;プロトタイプでは、追加使用を無効にしておくのが安全です。予期しない請求を避けられます。&lt;/p&gt;

&lt;p&gt;本番環境の自動化で停止が許容できない場合は、追加使用を有効にします。いずれの場合も、クレジットが先に消費され、上限を超えるまで超過料金は発生しません。&lt;/p&gt;

&lt;h2&gt;
  
  
  オプトインの方法
&lt;/h2&gt;

&lt;p&gt;クレジットはデフォルトでは有効になっていません。最初に1回だけ申請が必要です。&lt;/p&gt;

&lt;p&gt;手順：&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;&lt;p&gt;サブスクリプションを所有するClaudeアカウントにログインします。&lt;br&gt;&lt;br&gt;
Pro/Maxの個人アカウント、またはTeam/Enterpriseのシートアカウントです。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;Claude Agent SDKのプラン設定ページにアクセスします。&lt;br&gt;&lt;br&gt;
Anthropicの&lt;a href="https://support.claude.com/en/articles/15036540-use-the-claude-agent-sdk-with-your-claude-plan" rel="noopener noreferrer"&gt;公式サポート記事&lt;/a&gt;からリンクされています。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;クレジットを申請します。&lt;br&gt;&lt;br&gt;
申請後は、毎月自動的に更新されます。&lt;/p&gt;&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;チームプランの場合、各ユーザーが個別に申請する必要があります。管理者がシートメンバーの代わりに申請することはできません。&lt;/p&gt;

&lt;h2&gt;
  
  
  PythonでAgent SDKを設定する
&lt;/h2&gt;

&lt;p&gt;Agent SDKはPythonとTypeScriptで利用できます。どちらも、生のAPIキーではなくClaude Code CLI経由でプランに対して認証します。&lt;/p&gt;

&lt;p&gt;Python版をインストールします。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;pip &lt;span class="nb"&gt;install &lt;/span&gt;claude-agent-sdk
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Claude Codeにログインします。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;claude login
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;これにより、プランに紐づいた認証情報がローカルに保存されます。Python SDKはそれを自動的に取得します。プランベースの使用では、&lt;code&gt;ANTHROPIC_API_KEY&lt;/code&gt;を設定する必要はありません。&lt;/p&gt;

&lt;p&gt;最小構成のエージェントは次のようになります。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight python"&gt;&lt;code&gt;&lt;span class="kn"&gt;from&lt;/span&gt; &lt;span class="n"&gt;claude_agent_sdk&lt;/span&gt; &lt;span class="kn"&gt;import&lt;/span&gt; &lt;span class="n"&gt;Agent&lt;/span&gt;

&lt;span class="n"&gt;agent&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="nc"&gt;Agent&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="n"&gt;system_prompt&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;You are a code review assistant.&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="n"&gt;response&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;agent&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;run&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;Review the diff in /tmp/patch.diff and flag concerns.&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;span class="nf"&gt;print&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;response&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;text&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;以前は、この呼び出しに&lt;code&gt;ANTHROPIC_API_KEY&lt;/code&gt;と従量課金制のAPI請求が必要でした。現在は、プランのAgent SDKクレジットから消費されます。&lt;/p&gt;

&lt;h2&gt;
  
  
  TypeScriptでAgent SDKを設定する
&lt;/h2&gt;

&lt;p&gt;TypeScript版をインストールします。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;npm &lt;span class="nb"&gt;install&lt;/span&gt; @anthropic-ai/claude-agent-sdk
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Claude Codeにログインします。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;claude login
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;最小構成のエージェントは次のとおりです。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight typescript"&gt;&lt;code&gt;&lt;span class="k"&gt;import&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt; &lt;span class="nx"&gt;Agent&lt;/span&gt; &lt;span class="p"&gt;}&lt;/span&gt; &lt;span class="k"&gt;from&lt;/span&gt; &lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;@anthropic-ai/claude-agent-sdk&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="p"&gt;;&lt;/span&gt;

&lt;span class="kd"&gt;const&lt;/span&gt; &lt;span class="nx"&gt;agent&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="k"&gt;new&lt;/span&gt; &lt;span class="nc"&gt;Agent&lt;/span&gt;&lt;span class="p"&gt;({&lt;/span&gt;
  &lt;span class="na"&gt;systemPrompt&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;You are a code review assistant.&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;span class="p"&gt;});&lt;/span&gt;

&lt;span class="kd"&gt;const&lt;/span&gt; &lt;span class="nx"&gt;response&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="k"&gt;await&lt;/span&gt; &lt;span class="nx"&gt;agent&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;run&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
  &lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;Review the diff in /tmp/patch.diff and flag concerns.&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;
&lt;span class="p"&gt;);&lt;/span&gt;

&lt;span class="nx"&gt;console&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;log&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="nx"&gt;response&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;text&lt;/span&gt;&lt;span class="p"&gt;);&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;CIランナー、Dockerコンテナ、リモート開発環境など、SDKがClaude Codeの認証情報を自動検出できない環境では、認証情報を環境変数として設定できます。正確な変数名はAnthropicの&lt;a href="https://docs.claude.com/en/docs/agent-sdk" rel="noopener noreferrer"&gt;Agent SDKドキュメント&lt;/a&gt;を確認してください。&lt;/p&gt;

&lt;p&gt;SDKの前段でClaude Codeログインに失敗する場合は、&lt;a href="http://apidog.com/blog/fix-invalid-custom3p-enterprise-config-claude-code?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;無効なcustom3pエンタープライズ設定の修正&lt;/a&gt;を確認すると、よくある原因を切り分けられます。&lt;/p&gt;

&lt;h2&gt;
  
  
  &lt;code&gt;claude -p&lt;/code&gt;を自動化に組み込む
&lt;/h2&gt;

&lt;p&gt;Agent SDKクレジットを使うもう1つの方法が、Claude Codeの&lt;code&gt;claude -p&lt;/code&gt;です。&lt;/p&gt;

&lt;p&gt;&lt;code&gt;-p&lt;/code&gt;はClaude Codeを非対話モードにします。プロンプトを渡すと、リポジトリに対して実行して終了します。対話セッションはありません。&lt;/p&gt;

&lt;p&gt;用途は次のような自動化です。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;CIパイプライン&lt;/li&gt;
&lt;li&gt;cronジョブ&lt;/li&gt;
&lt;li&gt;Gitフック&lt;/li&gt;
&lt;li&gt;リリース前チェック&lt;/li&gt;
&lt;li&gt;差分レビュー&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;例：危険な変更を検出するプリコミットフック。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;&lt;span class="c"&gt;#!/usr/bin/env bash&lt;/span&gt;
&lt;span class="c"&gt;# .git/hooks/pre-commit&lt;/span&gt;

&lt;span class="nv"&gt;DIFF&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="si"&gt;$(&lt;/span&gt;git diff &lt;span class="nt"&gt;--cached&lt;/span&gt;&lt;span class="si"&gt;)&lt;/span&gt;

claude &lt;span class="nt"&gt;-p&lt;/span&gt; &lt;span class="s2"&gt;"Review this diff for security issues, secret leaks, and breaking changes. Return PASS or FAIL with reasoning:&lt;/span&gt;&lt;span class="se"&gt;\n\n&lt;/span&gt;&lt;span class="nv"&gt;$DIFF&lt;/span&gt;&lt;span class="s2"&gt;"&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;6月15日以降、&lt;code&gt;claude -p&lt;/code&gt;の呼び出しは対話型Claude Codeの予算ではなく、Agent SDKクレジットから消費されます。日常的なClaude Code利用枠を消費せずに、自動化ワークフローへ組み込めます。&lt;/p&gt;

&lt;p&gt;この使い方は、自律的なループのための&lt;a href="http://apidog.com/blog/goal-command-codex-claude-code-autonomous-agents?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;&lt;code&gt;/goal&lt;/code&gt;コマンド&lt;/a&gt;や、実行間でエージェントを安定して制御するための&lt;a href="http://apidog.com/blog/how-to-write-agents-md-files?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;AGENTS.mdコンテキストファイル&lt;/a&gt;と相性が良いです。&lt;/p&gt;

&lt;h2&gt;
  
  
  GitHub Actions連携で使う
&lt;/h2&gt;

&lt;p&gt;Claude CodeのGitHub Actions連携も、SDKクレジットでカバーされます。&lt;/p&gt;

&lt;p&gt;たとえば、次のようなワークフローにClaudeを組み込んでいる場合です。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;PRレビュー&lt;/li&gt;
&lt;li&gt;Issueトリアージ&lt;/li&gt;
&lt;li&gt;リリースノート生成&lt;/li&gt;
&lt;li&gt;変更内容の要約&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;これらのワークフロー実行は、GitHub AppをインストールしたユーザーのAgent SDKクレジットに対して請求されるようになりました。&lt;/p&gt;

&lt;p&gt;これは、&lt;a href="http://apidog.com/blog/clawsweeper-openclaw-github-triage-bot?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Claude Code上に構築されたGitHubトリアージボットであるClawsweeper&lt;/a&gt;のようなプロジェクトで特に有用です。継続的に実行される自動化で、以前はAppにアタッチされたAPIキーに請求されていたためです。&lt;/p&gt;

&lt;h2&gt;
  
  
  実用的なエージェントを構築する：SDKとApidogを組み合わせる
&lt;/h2&gt;

&lt;p&gt;Agent SDKの価値は、単にテキストを返すことではありません。実際のAPIを呼び出し、データベースをクエリし、デプロイや検証を実行するエージェントを作れる点にあります。&lt;/p&gt;

&lt;p&gt;ただし、エージェントが外部APIを扱う場合は、API契約が必要です。契約がないと、エージェントはリクエスト形式を推測し、デバッグの多くが誤ったペイロードの修正に費やされます。&lt;/p&gt;

&lt;p&gt;ここで&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;を使います。&lt;/p&gt;

&lt;p&gt;実装フローは次のとおりです。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;ApidogでAPI契約を定義する&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
エンドポイント、リクエストスキーマ、レスポンススキーマ、サンプルペイロードを仕様化します。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;OpenAPIをエクスポートする&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
エージェントにコンテキストとして渡せる形式にします。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Agent SDKで実エンドポイントへ接続する&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
エージェントは、正しいスキーマを前提にAPIを呼び出します。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;&lt;a href="http://apidog.com/blog/api-testing-tool-qa-engineers?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog CLI&lt;/a&gt;で検証する&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
エージェント実行ごとに、APIが契約どおりに応答するか確認します。&lt;/p&gt;&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;MCPサーバー経由で他のツールをオーケストレートするエージェントでは、&lt;a href="http://apidog.com/blog/mcp-server-testing-apidog?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidogを使用したMCPサーバーテストワークフロー&lt;/a&gt;が参考になります。エージェントが呼び出すツールに対して、エンドツーエンドのテストカバレッジを作れます。&lt;/p&gt;

&lt;p&gt;全体の設計は、&lt;a href="http://apidog.com/blog/api-platform-design-first-api-workflow?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;デザインファーストのAPIワークフローガイド&lt;/a&gt;で整理されています。エージェントが検証すべき契約を持っていれば、開発者はJSONスキーマのバグを追うのではなく、より良い契約と制約を書くことに集中できます。&lt;/p&gt;

&lt;p&gt;Agent SDKプロジェクトの契約層が必要な場合は、無料で&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidogをダウンロード&lt;/a&gt;できます。&lt;/p&gt;

&lt;h2&gt;
  
  
  それでも別のAPIキーが必要な場合
&lt;/h2&gt;

&lt;p&gt;プランベースのクレジットは、多くの開発者にとって適切なデフォルトです。ただし、スタンドアロンのAPIキーが適しているケースもあります。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;予測可能な予算管理が必要な本番環境エージェント&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
プランクレジットは固定額で上限があります。無制限にスケールするエージェントでは、使用量ベースのAPIキーのほうが、財務・運用チームにとって請求ラインを分けやすくなります。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;複数組織での共有アクセス&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
APIキーは単一ユーザーに紐づきません。チームが単一の請求元を共有したい場合は、APIキーが適しています。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;エンタープライズスタンダードシート&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
エンタープライズスタンダードシートにはAgent SDKクレジットが付与されません。SDKアクセスが必要な場合はAPIキーを使います。&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;a href="http://apidog.com/blog/get-free-unlimited-claude-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;無料のClaude APIアクセスガイド&lt;/a&gt;では、Proプランや有料APIキーを使わずにClaudeを利用する方法を扱っています。&lt;/p&gt;

&lt;h2&gt;
  
  
  開始前チェックリスト
&lt;/h2&gt;

&lt;p&gt;実装前に、次を確認してください。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;[ ] 自分のプランが対象に含まれている
Pro、Max 5x、Max 20x、チームスタンダード、チームプレミアム、エンタープライズ使用量ベース、エンタープライズプレミアムシート&lt;/li&gt;
&lt;li&gt;[ ] Agent SDKクレジットの1回限りのオプトインを申請した&lt;/li&gt;
&lt;li&gt;[ ] 追加使用を有効にするか決めた
プロトタイプではオフ、本番環境ではオンが基本&lt;/li&gt;
&lt;li&gt;[ ] &lt;code&gt;claude login&lt;/code&gt;を実行して、SDKをプランに対して認証した&lt;/li&gt;
&lt;li&gt;[ ] PythonまたはTypeScriptのSDKパッケージをインストールした&lt;/li&gt;
&lt;li&gt;[ ] 最小構成のエージェントを実行した&lt;/li&gt;
&lt;li&gt;[ ] &lt;code&gt;ANTHROPIC_API_KEY&lt;/code&gt;なしで動作することを確認した&lt;/li&gt;
&lt;li&gt;[ ] 最初の数回の実行後に、アカウント設定でクレジット残高を確認した&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  よくある質問
&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;プランクレジットを使うために、古い&lt;code&gt;ANTHROPIC_API_KEY&lt;/code&gt;を削除する必要がありますか？&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;SDKはClaude Codeのローカル認証情報が存在する場合、それを使用します。&lt;code&gt;claude login&lt;/code&gt;を実行すれば、SDKはプランベースの請求に切り替わります。他のツール用に&lt;code&gt;ANTHROPIC_API_KEY&lt;/code&gt;を環境変数として設定している場合は、そのままでも構いません。SDKはプラン認証が存在する場合、そちらを優先します。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;クレジットに対する1つの「リクエスト」とは何ですか？&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;クレジットはリクエスト数ではなくドル建てです。各SDK呼び出しは、Anthropicが公開しているAPI使用料と同じレートで請求されます。ツール使用やコンテキストトークンを含むモデル呼び出しのコストに応じて、クレジット残高が減っていきます。追加のリクエスト単位料金はありません。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;チームメイトとクレジットを共有できますか？&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;できません。クレジットはユーザーごとに付与され、譲渡できません。各チームまたはエンタープライズシートには、それぞれ独自のクレジットプールがあります。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;古いAnthropic APIコンソールの残高はどうなりますか？&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;そのまま残ります。プランクレジットは別の請求メカニズムです。APIコンソールに前払い残高がある場合、それは引き続きAPIキーを使うワークロードに適用されます。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Agent SDKはClaude Codeと同じですか？&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;違います。Claude CodeはAnthropicが提供する公式CLIおよびIDE拡張機能です。Agent SDKは、カスタムエージェントを構築するためのPython/TypeScriptライブラリです。&lt;/p&gt;

&lt;p&gt;クレジットは、Agent SDKとClaude Codeの非対話型&lt;code&gt;claude -p&lt;/code&gt;コマンドをカバーします。対話型Claude Codeは通常のプラン利用のままです。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;GitHub Actionsの請求は変わりますか？&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;Actionが公式のClaude Code GitHub Actions連携を使用し、クレジットがインストールユーザーのアカウントで申請されている場合、それらの実行はAPIキー請求ではなくSDKクレジットから消費されます。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;クレジットはAgent SDKや&lt;code&gt;claude -p&lt;/code&gt;以外でも使えますか？&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;対象は次の4つです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Python/TypeScriptのAgent SDK&lt;/li&gt;
&lt;li&gt;&lt;code&gt;claude -p&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;Claude Code GitHub Actions連携&lt;/li&gt;
&lt;li&gt;Agent SDKを使用するサードパーティアプリ&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;それ以外のClaude利用は、リクエストの発生元に応じて、通常のプラン制限またはAPIキー請求にフォールバックされます。&lt;/p&gt;

</description>
    </item>
  </channel>
</rss>
