<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/">
  <channel>
    <title>DEV Community: Akira</title>
    <description>The latest articles on DEV Community by Akira (@aakira).</description>
    <link>https://dev.to/aakira</link>
    <image>
      <url>https://media2.dev.to/dynamic/image/width=90,height=90,fit=cover,gravity=auto,format=auto/https:%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Fuser%2Fprofile_image%2F3816151%2Fbb126af7-07b9-4483-91c4-7f4ccabb61f5.png</url>
      <title>DEV Community: Akira</title>
      <link>https://dev.to/aakira</link>
    </image>
    <atom:link rel="self" type="application/rss+xml" href="https://dev.to/feed/aakira"/>
    <language>en</language>
    <item>
      <title>APIDOG 4月アップデート：AIエージェントデバッガー、A2Aデバッガー、Postman移行がより簡単に</title>
      <dc:creator>Akira</dc:creator>
      <pubDate>Wed, 29 Apr 2026 08:47:55 +0000</pubDate>
      <link>https://dev.to/aakira/apidog-4yue-atupudetoaiezientodebatuga-a2adebatuga-postmanyi-xing-gayorijian-dan-ni-4kdl</link>
      <guid>https://dev.to/aakira/apidog-4yue-atupudetoaiezientodebatuga-a2adebatuga-postmanyi-xing-gayorijian-dan-ni-4kdl</guid>
      <description>&lt;p&gt;4月のリリースは、AIエージェント開発をより検査しやすくすることに重点を置いています。最終回答だけでなく、そこに至るまでの実行過程を追跡できるようにするためのアップデートです。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;今すぐApidogを試す&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;エージェント開発で難しいのは、多くの場合「最終的な答え」ではありません。次のような途中経過を確認できるかどうかです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;エージェントはユーザーの意図をどう解釈したか&lt;/li&gt;
&lt;li&gt;どのツールを呼び出したか&lt;/li&gt;
&lt;li&gt;ツールから何が返ったか&lt;/li&gt;
&lt;li&gt;プロンプトが失敗したのか、ビジネスロジックが失敗したのか&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;今月のApidogでは、AI Agent Debugger、A2A Debugger、Postman API経由のインポート、公開ドキュメントのAsk AI改善、カスタムモデルプロバイダーが追加されました。&lt;/p&gt;

&lt;h2&gt;
  
  
  ⭐ 新機能
&lt;/h2&gt;

&lt;h3&gt;
  
  
  🔥 AI Agent Debugger: エージェントの実行全体を検査する
&lt;/h3&gt;

&lt;p&gt;Apidogは以前からSSEエンドポイントの視覚的なデバッグをサポートしていました。これは、モデル応答のストリーミング、進捗状況の更新、リアルタイム通知、イベント駆動型APIの確認に役立ちます。&lt;/p&gt;

&lt;p&gt;ただし、エージェントをデバッグするには、ストリームを見るだけでは不十分です。&lt;/p&gt;

&lt;p&gt;実際のプロジェクトでは、次のような実行ステップを追跡する必要があります。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;会話の各ターン&lt;/li&gt;
&lt;li&gt;モデル呼び出し&lt;/li&gt;
&lt;li&gt;MCPツール呼び出し&lt;/li&gt;
&lt;li&gt;カスタムスキルの実行&lt;/li&gt;
&lt;li&gt;ツールの戻り値&lt;/li&gt;
&lt;li&gt;最終出力&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;新しいAI Agent Debuggerでは、これらの実行パスをApidog内で確認できます。最終応答だけでなく、エージェントがどのように判断し、どの処理を経由して結果に到達したのかを一箇所で追跡できます。&lt;/p&gt;

&lt;p&gt;実装や検証では、次のような確認に使えます。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;プロンプトに十分なコンテキストが含まれているか&lt;/li&gt;
&lt;li&gt;エージェントが正しいツールを選択しているか&lt;/li&gt;
&lt;li&gt;MCPツールが期待どおりの結果を返しているか&lt;/li&gt;
&lt;li&gt;問題の原因がモデル設定、ツールパラメータ、ビジネスロジックのどこにあるか&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;エージェントシステムはすぐに複雑になります。AI Agent Debuggerを使うことで、チームは「実際に何が起きたか」をより具体的に確認できます。&lt;/p&gt;

&lt;h3&gt;
  
  
  🤝 A2A Debugger: エージェント間通信をテストする
&lt;/h3&gt;

&lt;p&gt;マルチエージェントシステムでは、エージェント同士がタスクを受け渡し、メッセージを交換し、結果を正しく返せるかを検証する必要があります。&lt;/p&gt;

&lt;p&gt;Apidogは、GoogleのA2A（Agent-to-Agent）プロトコルのデバッグをサポートしました。&lt;/p&gt;

&lt;p&gt;A2A Debuggerでは、次の作業をApidog内で行えます。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;A2Aリクエストを送信する&lt;/li&gt;
&lt;li&gt;リクエストパラメータを確認する&lt;/li&gt;
&lt;li&gt;レスポンスを検査する&lt;/li&gt;
&lt;li&gt;エージェント間のやり取りの結果を検証する&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;これにより、生のプロトコル詳細を手動で追ったり、複数のツールを行き来したりせずに、エージェント間通信をテストできます。&lt;/p&gt;

&lt;p&gt;AI Agent DebuggerとA2A Debuggerの使い分けはシンプルです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;AI Agent Debugger&lt;/strong&gt;: 単一のエージェント内部で何が起きたかを確認する&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;A2A Debugger&lt;/strong&gt;: あるエージェントが別のエージェントと正しく通信できるかを確認する&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;エージェント開発では、単体の実行検証とエージェント間通信の検証の両方が必要になります。&lt;/p&gt;

&lt;h3&gt;
  
  
  📦 Postman API経由でPostmanデータをインポートする
&lt;/h3&gt;

&lt;p&gt;PostmanからApidogへ移行する大規模チーム向けに、より扱いやすいインポート方法が追加されました。&lt;/p&gt;

&lt;p&gt;ApidogはこれまでもローカルのPostmanファイルのインポートをサポートしていました。今回のアップデートでは、Postman API経由で次のデータをインポートできます。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;ワークスペース&lt;/li&gt;
&lt;li&gt;コレクション&lt;/li&gt;
&lt;li&gt;環境&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fmwid60ncw5f2a04al02x.gif" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fmwid60ncw5f2a04al02x.gif" alt="Apidog-02.gif" width="600" height="347"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;この機能は、新しいプロジェクト作成時の大量移行を想定しています。Postmanアカウントに複数のワークスペースがある場合、Apidogはインポート後に対応するプロジェクトを作成します。&lt;/p&gt;

&lt;p&gt;移行時の流れは、ローカルエクスポート、アップロード、手動整理を減らす方向になります。&lt;/p&gt;

&lt;p&gt;使い分けの目安は次のとおりです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;小規模な移行: ローカルPostmanファイルのインポート&lt;/li&gt;
&lt;li&gt;大規模な移行: Postman API経由のインポート&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;ワークスペース全体を移行する場合は、API経由の方が手順を減らしやすくなります。&lt;/p&gt;

&lt;h3&gt;
  
  
  📄 公開ドキュメントの「Ask AI」がサイドバーで開くように
&lt;/h3&gt;

&lt;p&gt;公開ドキュメントの「Ask AI」が、サイドバーで動作するようになりました。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fv62vgvv4f1t4vyq6year.gif" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fv62vgvv4f1t4vyq6year.gif" alt="Apidog-01.gif" width="560" height="323"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;読者は、現在のドキュメントページを開いたまま、その内容について質問できます。&lt;/p&gt;

&lt;p&gt;これにより、次のような使い方がしやすくなります。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;APIドキュメントを読みながら質問する&lt;/li&gt;
&lt;li&gt;回答を確認したあと、同じページで続けて調べる&lt;/li&gt;
&lt;li&gt;長いドキュメント内の該当箇所を見失わずに確認する&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;特に長いAPIドキュメントでは、答えがページ内にあってもすぐに見つけにくいことがあります。サイドバー表示により、ドキュメントの文脈を維持したまま質問できます。&lt;/p&gt;

&lt;h3&gt;
  
  
  🧠 カスタムAIモデルプロバイダー
&lt;/h3&gt;

&lt;p&gt;カスタムのベースURLを使って、独自のAIモデルプロバイダーを接続できるようになりました。&lt;/p&gt;

&lt;p&gt;すでに次のような構成を使っているチームでは、ApidogのAI関連ワークフローに既存の設定を持ち込めます。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;自己ホスト型モデルサービス&lt;/li&gt;
&lt;li&gt;社内モデルゲートウェイ&lt;/li&gt;
&lt;li&gt;カスタムプロバイダー&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;これにより、AIワークフローをデバッグするたびに別のツールへ切り替える必要を減らせます。&lt;/p&gt;

&lt;h2&gt;
  
  
  🐞 バグ修正と小規模な改善
&lt;/h2&gt;

&lt;p&gt;今月は、以下の修正と品質改善も行いました。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;OpenAPIのスマートマージで、エンドポイントの応答例が保持されない問題を修正&lt;/li&gt;
&lt;li&gt;子ブランチから保護されたメインブランチにマージする際、選択されていないエンドポイントが含まれる可能性がある問題を修正&lt;/li&gt;
&lt;li&gt;ブランチからエンドポイントバージョンを作成する際のドロップダウン表示の誤りを修正&lt;/li&gt;
&lt;li&gt;CLI経由でテストを実行する際に、TestDataとTestCasesが動作しない問題を修正&lt;/li&gt;
&lt;li&gt;OpenAPIエクスポートで、関連性のないモジュールからのレスポンスコンポーネントが含まれる問題を修正&lt;/li&gt;
&lt;li&gt;コメント付きJSONのMarkdownエクスポート書式を修正&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;crypto is not defined&lt;/code&gt; が原因で発生するWordエクスポートエラーを修正&lt;/li&gt;
&lt;li&gt;Basic認証が有効なKnife4jをインポートする際に、ユーザー名とパスワードのフィールドが表示されない問題を修正&lt;/li&gt;
&lt;li&gt;タグが数字の場合のエンドポイントフィルタリングエラーを修正&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;apidog endpoint list --branch&lt;/code&gt; が指定されたブランチのデータを返さない問題を修正&lt;/li&gt;
&lt;li&gt;複数のMCPツールパラメータ、フィルタリング、エラーメッセージの問題を修正&lt;/li&gt;
&lt;li&gt;生成されたコードに &lt;code&gt;typescriptThreePlus&lt;/code&gt; 設定オプションが欠落していた問題を修正&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  🌟 実装チームにとってのポイント
&lt;/h2&gt;

&lt;p&gt;4月のリリースは、AIエージェントを実運用に近い形で開発・検証するチーム向けのアップデートです。&lt;/p&gt;

&lt;p&gt;主な使いどころは次のとおりです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;AI Agent Debugger&lt;/strong&gt;: 単一エージェントの実行過程を検査する&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;A2A Debugger&lt;/strong&gt;: エージェント間通信をテストする&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Postman APIインポート&lt;/strong&gt;: 大規模なPostman移行を簡略化する&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Ask AIサイドバー&lt;/strong&gt;: 公開ドキュメントを読みながら質問できるようにする&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;カスタムモデルプロバイダー&lt;/strong&gt;: 既存のAIモデル基盤をApidog内で利用する&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;エージェント開発がデモ段階から実プロジェクトへ進むと、最終結果だけでなく、途中の判断、ツール呼び出し、レスポンス、通信内容を確認する必要があります。今回の機能は、その検証作業を進めやすくするためのものです。&lt;/p&gt;

&lt;h2&gt;
  
  
  💬 会話に参加する
&lt;/h2&gt;

&lt;p&gt;APIエンジニア仲間やApidogチームとつながりましょう。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;リアルタイムの議論とサポートには、&lt;a href="https://discord.com/invite/ZBxrzyXfbJ" rel="noopener noreferrer"&gt;Discord&lt;/a&gt;コミュニティをご利用ください。&lt;/li&gt;
&lt;li&gt;技術的な会話には、&lt;a href="https://join.slack.com/t/apidogcommunity/shared_invite/zt-2neie4nh2-4_zhufuNBmCq4EtI6fZUwA" rel="noopener noreferrer"&gt;Slack&lt;/a&gt;コミュニティをご利用ください。&lt;/li&gt;
&lt;li&gt;最新アップデートは、&lt;a href="https://x.com/ApidogHQ" rel="noopener noreferrer"&gt;X (Twitter)&lt;/a&gt;で確認できます。&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;すべてのアップデートの詳細は、&lt;a href="https://apidog.canny.io/changelog/" rel="noopener noreferrer"&gt;Apidogチェンジログ&lt;/a&gt;をご覧ください。&lt;/p&gt;

&lt;p&gt;敬具、&lt;br&gt;&lt;br&gt;
Apidogチーム&lt;/p&gt;

</description>
    </item>
    <item>
      <title>GitHub Copilot 請求体系と API チームへの影響</title>
      <dc:creator>Akira</dc:creator>
      <pubDate>Wed, 29 Apr 2026 07:07:14 +0000</pubDate>
      <link>https://dev.to/aakira/github-copilot-qing-qiu-ti-xi-to-api-timuhenoying-xiang-3l47</link>
      <guid>https://dev.to/aakira/github-copilot-qing-qiu-ti-xi-to-api-timuhenoying-xiang-3l47</guid>
      <description>&lt;p&gt;GitHub Copilotの課金モデルは昨年2回変更され、今月さらに変更されました。今月から、プルリクエストでのCopilotコードレビューは、リポジトリを所有する課金アカウントのGitHub Actions実行時間（Actions minutes）を消費します。APIチームは、Copilotシート、プレミアムリクエスト、Actions実行時間の3つを同時に管理する必要があります。この記事では、それぞれの測定基準、APIリポジトリへの影響、請求前にコストを見積もる手順を整理します。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;今すぐApidogを試す&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;Apidog内のワークフローと組み合わせると、API仕様、契約テスト、AIレビューの各ステップを、3つの異なる課金ダッシュボードに分散させず、1つの流れとして管理できます。&lt;/p&gt;

&lt;p&gt;チームが直接利用するモデルAPIのコストも計算している場合は、&lt;a href="http://apidog.com/blog/gpt-5-5-pricing?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;GPT-5.5の料金体系&lt;/a&gt;と&lt;a href="http://apidog.com/blog/deepseek-v4-api-pricing?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeek V4の料金体系&lt;/a&gt;も確認してください。トークン単位のコスト見積もりに役立ちます。&lt;/p&gt;

&lt;h2&gt;
  
  
  TL;DR（要点）
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;Copilotのコストは、シートライセンス、プレミアムリクエスト、Copilotコードレビュー用Actions実行時間の3つで見る。&lt;/li&gt;
&lt;li&gt;PR上のCopilotコードレビューは、内部的にGitHub Actionsとして実行され、通常のActionsクォータを消費する。&lt;/li&gt;
&lt;li&gt;APIリポジトリは、仕様、生成クライアント、ハンドラ、テストをまとめて変更しやすいため、1レビューあたりの実行時間が増えやすい。&lt;/li&gt;
&lt;li&gt;プレミアムリクエストは、Workspace、エージェントモード、Copilot Spacesなどの「エージェント的」な作業に関係する。&lt;/li&gt;
&lt;li&gt;次の請求サイクル前に利用制限を設定する。アクティブなAPIリポジトリごとに月400〜800 Actions実行時間を仮予算として置き、30日後に実測で見直す。&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  Copilot課金で見るべき3つの測定基準
&lt;/h2&gt;

&lt;p&gt;Copilotの請求は、現在1つの固定料金だけではありません。以下の3つに分けて管理します。&lt;/p&gt;

&lt;h2&gt;
  
  
  測定基準1：シートごとのライセンス
&lt;/h2&gt;

&lt;p&gt;これは固定料金です。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Copilot Business：ユーザーあたり月額10ドル&lt;/li&gt;
&lt;li&gt;Copilot Enterprise：ユーザーあたり月額19ドル&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;この料金には、チャット、インライン補完、複数行の提案、IDE連携、標準モデルプールへのアクセスが含まれます。&lt;/p&gt;

&lt;p&gt;実装面でやることはシンプルです。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;アクティブな開発者を一覧化する&lt;/li&gt;
&lt;li&gt;直近30〜90日でCopilotを使っていないユーザーを確認する&lt;/li&gt;
&lt;li&gt;四半期ごとに未使用シートを回収する&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;シートは最も予測しやすい一方で、過剰に割り当てられやすい項目です。&lt;/p&gt;

&lt;h2&gt;
  
  
  測定基準2：プレミアムリクエスト
&lt;/h2&gt;

&lt;p&gt;プレミアムリクエストは、より高価なCopilot機能を使うときの単位です。&lt;/p&gt;

&lt;p&gt;対象になりやすいものは次の通りです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;エージェントモード&lt;/li&gt;
&lt;li&gt;Workspace&lt;/li&gt;
&lt;li&gt;Copilot Spaces&lt;/li&gt;
&lt;li&gt;デフォルト以外のモデル選択&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;現在の料金イメージは以下です。料金は変更される可能性があります。&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;機能&lt;/th&gt;
&lt;th&gt;プレミアムリクエストでのコスト&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;デフォルトモデルのチャット&lt;/td&gt;
&lt;td&gt;有料プランでは無料&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;インライン補完&lt;/td&gt;
&lt;td&gt;有料プランでは無料&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;エージェントモード（デフォルトモデル）&lt;/td&gt;
&lt;td&gt;リクエストあたり1&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Workspace（デフォルトモデル）&lt;/td&gt;
&lt;td&gt;リクエストあたり1&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Claude Sonnet 4.5の選択&lt;/td&gt;
&lt;td&gt;1.5倍&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;GPT-5.5の選択&lt;/td&gt;
&lt;td&gt;2倍&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;GPT-5.5 Proの選択&lt;/td&gt;
&lt;td&gt;6倍&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Copilot Spacesクエリ&lt;/td&gt;
&lt;td&gt;クエリあたり1&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;含まれる月間クォータは次の通りです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Copilot Business：シートあたり300プレミアムリクエスト&lt;/li&gt;
&lt;li&gt;Copilot Enterprise：シートあたり1,000プレミアムリクエスト&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;超過分は、リクエストあたり0.04ドルで請求され、組織に設定した利用制限で上限を管理できます。&lt;/p&gt;

&lt;p&gt;APIチームで注意すべき操作は、次のようなエージェントタスクです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;「OpenAPIクライアントを再生成して」&lt;/li&gt;
&lt;li&gt;「この新しいエンドポイントの契約テストを作って」&lt;/li&gt;
&lt;li&gt;「このAPI変更に合わせてハンドラとテストを更新して」&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;これらは内部で複数ステップに分かれることがあり、1つのプロンプトが複数のプレミアムリクエストとして扱われる場合があります。&lt;/p&gt;

&lt;h2&gt;
  
  
  測定基準3：Actions実行時間（Copilotコードレビュー）
&lt;/h2&gt;

&lt;p&gt;今月の変更で特に注意すべき点です。&lt;/p&gt;

&lt;p&gt;Copilotがプルリクエストで自動コードレビューを実行すると、そのレビューはGitHub Actionsインフラ上で実行されます。そのため、レビューに使った実行時間は、組織の通常のActionsクォータから差し引かれます。&lt;/p&gt;

&lt;p&gt;押さえるべきポイントは2つです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Copilotコードレビュー用に別枠のクォータがあるわけではない&lt;/li&gt;
&lt;li&gt;プライベートリポジトリではActions実行時間の予算を消費するが、パブリックリポジトリではActionsが無料&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;GitHubプランのActionsクォータ例：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Teamプラン：月額3,000分&lt;/li&gt;
&lt;li&gt;Enterpriseプラン：Linuxランナーで50,000分&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;API PRに対するCopilotコードレビューは、通常2〜6 Actions実行時間を消費します。差分が大きい場合や、リポジトリ全体のコンテキストを読む場合は15分程度に達することもあります。&lt;/p&gt;

&lt;h2&gt;
  
  
  APIリポジトリでコストが増えやすい理由
&lt;/h2&gt;

&lt;p&gt;APIリポジトリは、通常のアプリケーションコードよりもCopilotレビューの対象が広くなりがちです。&lt;/p&gt;

&lt;h2&gt;
  
  
  1. PRが大きくなりやすい
&lt;/h2&gt;

&lt;p&gt;典型的なAPI変更では、次のファイルが同時に変わります。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;code&gt;openapi.yaml&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;生成されたクライアント&lt;/li&gt;
&lt;li&gt;サーバーハンドラ&lt;/li&gt;
&lt;li&gt;契約テスト&lt;/li&gt;
&lt;li&gt;ドキュメントやサンプルリクエスト&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Copilotレビューはこれらを読み込むため、単一ファイルのUI修正よりも実行時間が長くなります。&lt;/p&gt;

&lt;h2&gt;
  
  
  2. 生成コードが差分を大きくする
&lt;/h2&gt;

&lt;p&gt;生成クライアントをリポジトリにコミットしている場合、API仕様の小さな変更でも大量の差分が出ます。&lt;/p&gt;

&lt;p&gt;Copilotレビューが生成コードまで読むと、実行時間とトークン量の両方が増えます。レビュー対象にする価値が低いファイルは、パスフィルターで除外するべきです。&lt;/p&gt;

&lt;h2&gt;
  
  
  3. PRごとに複数のレビューエージェントが走る
&lt;/h2&gt;

&lt;p&gt;多くのAPIチームでは、Copilotレビュー以外にも以下を実行しています。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;CodeQL&lt;/li&gt;
&lt;li&gt;Snyk&lt;/li&gt;
&lt;li&gt;カスタムセキュリティスキャナー&lt;/li&gt;
&lt;li&gt;契約テスト&lt;/li&gt;
&lt;li&gt;Lint&lt;/li&gt;
&lt;li&gt;E2Eテスト&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Copilotレビューはこの上に追加されるため、CI全体のActions消費が増えます。&lt;/p&gt;

&lt;p&gt;例：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;月50 PR&lt;/li&gt;
&lt;li&gt;1レビューあたり4分&lt;/li&gt;
&lt;li&gt;Copilotレビューだけで月200 Actions実行時間&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;これは、Teamプランの月間3,000分の約7%です。3つのAPIリポジトリで同じ規模なら、CI本体を走らせる前に約21%を使う計算になります。&lt;/p&gt;

&lt;h2&gt;
  
  
  月額請求額を見積もる手順
&lt;/h2&gt;

&lt;p&gt;請求前に、次の3ステップで概算を作ります。&lt;/p&gt;

&lt;h2&gt;
  
  
  ステップ1：シート数を計算する
&lt;/h2&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;seats = active_users × $10  (Business)
      = active_users × $19  (Enterprise)
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;例：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;10 developers × $19 = $190/month
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;実装上は、月末にGitHubの課金UIからCSVをエクスポートし、アクティブユーザー数を記録します。&lt;/p&gt;

&lt;h2&gt;
  
  
  ステップ2：プレミアムリクエストを計算する
&lt;/h2&gt;

&lt;p&gt;開発者ごとの利用量をざっくり分類します。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;チャット中心：月150リクエスト程度&lt;/li&gt;
&lt;li&gt;Workspaceやエージェント利用が多い：月600〜800リクエスト程度&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Businessプランではシートあたり300リクエストが含まれるため、エージェント利用が多いユーザーから超過しやすくなります。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;premium_overage = max(0, requests_used - included_quota) × $0.04
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Businessの場合：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;included_quota = seats × 300
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Enterpriseの場合：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;included_quota = seats × 1000
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;組織レベルで利用制限を設定し、エージェントループが暴走しても予算を超えないようにします。&lt;/p&gt;

&lt;h2&gt;
  
  
  ステップ3：CopilotコードレビューのActions実行時間を計算する
&lt;/h2&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;review_minutes = prs_per_month × average_minutes_per_review
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;中規模のAPI PRなら、平均4分を初期値として使えます。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;review_minutes = prs_per_month × 4
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;超過料金の概算：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;review_overage = max(0, review_minutes - actions_quota_remaining)
                 × $0.008  (Linux private repos)
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;例：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;10人のEnterpriseチーム&lt;/li&gt;
&lt;li&gt;月200 PR&lt;/li&gt;
&lt;li&gt;1レビュー平均4分
&lt;/li&gt;
&lt;/ul&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;review_minutes = 200 × 4 = 800 minutes
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;概算：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;シート：$190&lt;/li&gt;
&lt;li&gt;プレミアム超過：$40&lt;/li&gt;
&lt;li&gt;レビュー実行時間：800分。Enterpriseクォータ内なら$0&lt;/li&gt;
&lt;li&gt;合計：シート基本料金に加えて約$230&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;BusinessティアではActionsクォータが小さいため、同じPR数でも超過に早く到達します。&lt;/p&gt;

&lt;h2&gt;
  
  
  CIパイプラインで最初に変更すべきこと
&lt;/h2&gt;

&lt;p&gt;コストを下げるには、Copilotレビューを「すべてのPRで無条件に実行」しないことが重要です。&lt;/p&gt;

&lt;h2&gt;
  
  
  1. botやdependabotのPRではCopilotレビューをスキップする
&lt;/h2&gt;

&lt;p&gt;RenovateやDependabotによるバージョンアップに、毎回AIレビューは不要です。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight yaml"&gt;&lt;code&gt;&lt;span class="na"&gt;on&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt;
  &lt;span class="na"&gt;pull_request&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt;
    &lt;span class="na"&gt;types&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt; &lt;span class="pi"&gt;[&lt;/span&gt;&lt;span class="nv"&gt;opened&lt;/span&gt;&lt;span class="pi"&gt;,&lt;/span&gt; &lt;span class="nv"&gt;synchronize&lt;/span&gt;&lt;span class="pi"&gt;]&lt;/span&gt;

&lt;span class="na"&gt;jobs&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt;
  &lt;span class="na"&gt;copilot-review&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt;
    &lt;span class="na"&gt;if&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt; &lt;span class="s"&gt;github.actor != 'dependabot[bot]' &amp;amp;&amp;amp; github.actor != 'renovate[bot]'&lt;/span&gt;
    &lt;span class="na"&gt;runs-on&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt; &lt;span class="s"&gt;ubuntu-latest&lt;/span&gt;
    &lt;span class="na"&gt;steps&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt;
      &lt;span class="pi"&gt;-&lt;/span&gt; &lt;span class="na"&gt;uses&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt; &lt;span class="s"&gt;github/copilot-review@v1&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;対象にしたいbotが社内にある場合は、同じ条件に追加します。&lt;/p&gt;

&lt;h2&gt;
  
  
  2. 生成クライアントをレビュー対象から外す
&lt;/h2&gt;

&lt;p&gt;生成コードは差分が大きく、レビューコストを押し上げます。&lt;/p&gt;

&lt;p&gt;パスフィルターで、レビュー対象を人間が編集するファイルに絞ります。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight yaml"&gt;&lt;code&gt;&lt;span class="na"&gt;on&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt;
  &lt;span class="na"&gt;pull_request&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt;
    &lt;span class="na"&gt;paths&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt;
      &lt;span class="pi"&gt;-&lt;/span&gt; &lt;span class="s1"&gt;'&lt;/span&gt;&lt;span class="s"&gt;apis/**/*.yaml'&lt;/span&gt;
      &lt;span class="pi"&gt;-&lt;/span&gt; &lt;span class="s1"&gt;'&lt;/span&gt;&lt;span class="s"&gt;cmd/**'&lt;/span&gt;
      &lt;span class="pi"&gt;-&lt;/span&gt; &lt;span class="s1"&gt;'&lt;/span&gt;&lt;span class="s"&gt;internal/**'&lt;/span&gt;
      &lt;span class="pi"&gt;-&lt;/span&gt; &lt;span class="s1"&gt;'&lt;/span&gt;&lt;span class="s"&gt;tests/**'&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;生成クライアントが以下のような場所にあるなら、Copilotレビューの対象から外します。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;generated/**
clients/**
sdk/**
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h2&gt;
  
  
  3. 契約検証に成功した場合だけCopilotレビューを実行する
&lt;/h2&gt;

&lt;p&gt;Copilotレビューは、パイプライン内で比較的高価なステップです。先に安価なチェックを走らせ、失敗したPRではレビューをスキップします。&lt;/p&gt;

&lt;p&gt;例：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight yaml"&gt;&lt;code&gt;&lt;span class="na"&gt;jobs&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt;
  &lt;span class="na"&gt;contract-test&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt;
    &lt;span class="na"&gt;runs-on&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt; &lt;span class="s"&gt;ubuntu-latest&lt;/span&gt;
    &lt;span class="na"&gt;steps&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt;
      &lt;span class="pi"&gt;-&lt;/span&gt; &lt;span class="na"&gt;uses&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt; &lt;span class="s"&gt;actions/checkout@v4&lt;/span&gt;
      &lt;span class="pi"&gt;-&lt;/span&gt; &lt;span class="na"&gt;name&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt; &lt;span class="s"&gt;Run contract tests&lt;/span&gt;
        &lt;span class="na"&gt;run&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt; &lt;span class="s"&gt;apidog-cli test&lt;/span&gt;

  &lt;span class="na"&gt;copilot-review&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt;
    &lt;span class="na"&gt;needs&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt; &lt;span class="s"&gt;contract-test&lt;/span&gt;
    &lt;span class="na"&gt;if&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt; &lt;span class="s"&gt;success()&lt;/span&gt;
    &lt;span class="na"&gt;runs-on&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt; &lt;span class="s"&gt;ubuntu-latest&lt;/span&gt;
    &lt;span class="na"&gt;steps&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt;
      &lt;span class="pi"&gt;-&lt;/span&gt; &lt;span class="na"&gt;uses&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt; &lt;span class="s"&gt;github/copilot-review@v1&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;これにより、仕様や契約テストが壊れているPRに対して、高価なレビューを実行せずに済みます。&lt;/p&gt;

&lt;h2&gt;
  
  
  ガバナンス：APIチームが設定すべき4項目
&lt;/h2&gt;

&lt;p&gt;次の設定は、予期しない請求を避けるために優先して実施します。&lt;/p&gt;

&lt;h2&gt;
  
  
  1. 組織レベルの利用制限
&lt;/h2&gt;

&lt;p&gt;リポジトリ単位ではなく、組織レベルで上限を設定します。&lt;/p&gt;

&lt;p&gt;推奨手順：&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;現在の月間利用量を確認する&lt;/li&gt;
&lt;li&gt;許容できる最大金額を決める&lt;/li&gt;
&lt;li&gt;その80%程度を初期上限にする&lt;/li&gt;
&lt;li&gt;30日後に実測で調整する&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;デフォルトの無制限運用は、監視していないチームには危険です。&lt;/p&gt;

&lt;h2&gt;
  
  
  2. プレミアムリクエストのアラート
&lt;/h2&gt;

&lt;p&gt;GitHubは、含まれるクォータの50%、75%、90%に達したときに通知します。&lt;/p&gt;

&lt;p&gt;メールだけに頼らず、次のような場所に流します。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Slack&lt;/li&gt;
&lt;li&gt;Microsoft Teams&lt;/li&gt;
&lt;li&gt;PagerDuty&lt;/li&gt;
&lt;li&gt;インシデント管理ツール&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  3. Copilotレビュー起動ポリシー
&lt;/h2&gt;

&lt;p&gt;すべてのPRでレビューを走らせるのではなく、明示的に対象を決めます。&lt;/p&gt;

&lt;p&gt;例：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;code&gt;review-please&lt;/code&gt; ラベルがあるPRだけ実行&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;api-change&lt;/code&gt; ラベルがあるPRだけ実行&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;generated/**&lt;/code&gt; のみ変更されたPRではスキップ&lt;/li&gt;
&lt;li&gt;botのPRではスキップ&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;ラベル駆動にすると、実際にレビュー価値があるPRを残しつつ、コストを大きく削減できます。&lt;/p&gt;

&lt;h2&gt;
  
  
  4. チーム単位の有効化
&lt;/h2&gt;

&lt;p&gt;Copilot Enterpriseの機能は、組織全体で一括有効化するのではなく、チーム単位で展開します。&lt;/p&gt;

&lt;p&gt;推奨パターン：&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;API基盤チームで試す&lt;/li&gt;
&lt;li&gt;30日間の利用量を測る&lt;/li&gt;
&lt;li&gt;パスフィルターと上限を調整する&lt;/li&gt;
&lt;li&gt;他チームへ展開する&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;新機能をリリース直後に全員へ有効化すると、コストの増加要因を特定しにくくなります。&lt;/p&gt;

&lt;h2&gt;
  
  
  Apidogの役割
&lt;/h2&gt;

&lt;p&gt;&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;はCopilotの代替ではありません。API仕様、モック、契約テストを1つの流れにまとめ、Copilotレビューの前に安価な検証を実行するための層です。&lt;/p&gt;

&lt;p&gt;実装パターンは次の通りです。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;API仕様と保存済みリクエスト例を、リポジトリと一緒に管理する&lt;/li&gt;
&lt;li&gt;契約テストをライブAPIではなくApidogのモックサーバーに対して実行する&lt;/li&gt;
&lt;li&gt;Copilotレビューは、仕様例の更新漏れではなく、ハンドラのロジックやテストカバレッジに集中させる&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;apidog-cli&lt;/code&gt; で契約検証を先に実行し、成功した場合だけCopilotレビューを起動する&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Copilotレビューはパイプライン内で高価なステップになりやすいため、実行順序が重要です。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;OpenAPI/Apidog contract check
        ↓
unit tests
        ↓
security scan
        ↓
Copilot review
        ↓
merge
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;契約違反で早く失敗させれば、レビュー実行時間を本当に必要なPRに集中できます。&lt;/p&gt;

&lt;p&gt;Apidogのモックワークフローについては、&lt;a href="http://apidog.com/blog/api-testing-without-postman-2026?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;PostmanなしでのAPIテストガイド&lt;/a&gt;を参照してください。モデルAPIへの適用例は、&lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeek V4 APIガイド&lt;/a&gt;で確認できます。&lt;/p&gt;

&lt;h2&gt;
  
  
  次の請求サイクルで確認すること
&lt;/h2&gt;

&lt;p&gt;次の30日間は、以下のタイミングで利用状況を確認します。&lt;/p&gt;

&lt;h2&gt;
  
  
  1日目〜7日目
&lt;/h2&gt;

&lt;p&gt;プレミアムリクエストの利用量は、通常まだ低く見えます。多くのチームは、最初の週ではシートあたり300の含まれるクォータを下回ります。&lt;/p&gt;

&lt;p&gt;確認すること：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;アクティブユーザー数&lt;/li&gt;
&lt;li&gt;Copilotレビューが起動したPR数&lt;/li&gt;
&lt;li&gt;bot PRでレビューが走っていないか&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  14日目〜21日目
&lt;/h2&gt;

&lt;p&gt;ヘビーユーザーが含まれるクォータを超え始めます。&lt;/p&gt;

&lt;p&gt;確認すること：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Workspaceやエージェントモードの利用者&lt;/li&gt;
&lt;li&gt;プレミアムリクエスト上位ユーザー&lt;/li&gt;
&lt;li&gt;利用制限に近づいているか&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;制限を設定している場合、上限に達したユーザーのリクエストは失敗し始めます。制限がない場合は、請求額が増加します。&lt;/p&gt;

&lt;h2&gt;
  
  
  28日目〜30日目
&lt;/h2&gt;

&lt;p&gt;CopilotレビューによるActions実行時間が積み上がります。&lt;/p&gt;

&lt;p&gt;確認すること：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;前月と比べたActions利用量&lt;/li&gt;
&lt;li&gt;Copilotレビューだけの推定実行時間&lt;/li&gt;
&lt;li&gt;パスフィルター導入前後の差&lt;/li&gt;
&lt;li&gt;PR数との相関&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;月末には次を実施します。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;非アクティブユーザーのシート削減&lt;/li&gt;
&lt;li&gt;ヘビーユーザーをEnterpriseティアへ移すか検討&lt;/li&gt;
&lt;li&gt;レビューワークフローのパスフィルターを調整&lt;/li&gt;
&lt;li&gt;bot PRや生成コードの除外漏れを確認&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  よくある間違い
&lt;/h2&gt;

&lt;p&gt;APIチームで起きやすい問題は次の5つです。&lt;/p&gt;

&lt;h2&gt;
  
  
  1. 利用制限を設定していない
&lt;/h2&gt;

&lt;p&gt;単一のエージェントループが長時間実行される可能性があります。必ず組織レベルで上限を設定します。&lt;/p&gt;

&lt;h2&gt;
  
  
  2. すべてのリポジトリでレビューを有効にしている
&lt;/h2&gt;

&lt;p&gt;Copilotレビューが有効なリポジトリを選びます。&lt;/p&gt;

&lt;p&gt;優先度が高いもの：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;APIゲートウェイ&lt;/li&gt;
&lt;li&gt;認証・認可まわり&lt;/li&gt;
&lt;li&gt;課金や決済API&lt;/li&gt;
&lt;li&gt;外部公開API&lt;/li&gt;
&lt;li&gt;契約テストが重要なサービス&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;優先度が低いもの：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;生成SDKのみのリポジトリ&lt;/li&gt;
&lt;li&gt;ドキュメントだけのリポジトリ&lt;/li&gt;
&lt;li&gt;bot更新が中心のリポジトリ&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  3. 生成クライアントをレビューしている
&lt;/h2&gt;

&lt;p&gt;生成コードは差分が大きく、レビュー価値が低いことが多いです。パスフィルターで除外します。&lt;/p&gt;

&lt;h2&gt;
  
  
  4. bot PRをレビューしている
&lt;/h2&gt;

&lt;p&gt;Dependabot、Renovate、社内の自動バージョンアップツールを除外します。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight yaml"&gt;&lt;code&gt;&lt;span class="na"&gt;if&lt;/span&gt;&lt;span class="pi"&gt;:&lt;/span&gt; &lt;span class="s"&gt;github.actor != 'dependabot[bot]' &amp;amp;&amp;amp; github.actor != 'renovate[bot]'&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;必要に応じて、社内botも追加します。&lt;/p&gt;

&lt;h2&gt;
  
  
  5. ベースライン指標がない
&lt;/h2&gt;

&lt;p&gt;変更前の利用量がなければ、最適化の効果を判断できません。&lt;/p&gt;

&lt;p&gt;毎月保存する指標：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Copilotシート数&lt;/li&gt;
&lt;li&gt;プレミアムリクエスト利用量&lt;/li&gt;
&lt;li&gt;Actions実行時間&lt;/li&gt;
&lt;li&gt;月間PR数&lt;/li&gt;
&lt;li&gt;Copilotレビュー起動回数&lt;/li&gt;
&lt;li&gt;bot PR数&lt;/li&gt;
&lt;li&gt;生成コードのみのPR数&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;GitHubの課金UIからCSVをエクスポートし、月次で比較します。&lt;/p&gt;

&lt;h2&gt;
  
  
  よくある質問
&lt;/h2&gt;

&lt;h2&gt;
  
  
  シート価格はまだユーザーあたり10ドルですか？
&lt;/h2&gt;

&lt;p&gt;Copilot Businessはユーザーあたり月額10ドル、Copilot Enterpriseはユーザーあたり月額19ドルです。個人向けのCopilot Proは月額10ドルです。シートティアによって、含まれるプレミアムリクエストのクォータが変わります。&lt;/p&gt;

&lt;h2&gt;
  
  
  インライン補完も課金対象になりましたか？
&lt;/h2&gt;

&lt;p&gt;いいえ。有料プランでは、デフォルトモデルのチャットとインライン補完は課金対象外です。プレミアムリクエストは、より高価な機能やモデル選択に使われます。&lt;/p&gt;

&lt;h2&gt;
  
  
  プレミアムクォータがなくなった場合はどうなりますか？
&lt;/h2&gt;

&lt;p&gt;デフォルトでは、クォータエラーでリクエストが失敗し始めます。利用制限を設定している場合は、その上限まで1リクエストあたり0.04ドルで超過を許可できます。&lt;/p&gt;

&lt;h2&gt;
  
  
  Copilotコードレビュー用のActions実行時間は個別に請求されますか？
&lt;/h2&gt;

&lt;p&gt;いいえ。CIの他のジョブと同じActions実行時間プールを消費します。合計Actions利用状況を追跡し、必要に応じてワークフロートリガーやパスフィルターを調整してください。&lt;/p&gt;

&lt;h2&gt;
  
  
  Copilotコードレビューを完全に無効にできますか？
&lt;/h2&gt;

&lt;p&gt;はい。組織管理者は、ポリシーレベルでリポジトリをオプトアウトできます。同じ設定でチームごとの有効化も制御できます。&lt;/p&gt;

&lt;h2&gt;
  
  
  CopilotレビューはプライベートAPI仕様でも機能しますか？
&lt;/h2&gt;

&lt;p&gt;はい。プライベートリポジトリでも動作します。ただし、プライベートリポジトリではActions実行時間を消費します。レビューは、他のソースコードと同様に仕様ファイルやハンドラファイルを読み込みます。&lt;/p&gt;

&lt;h2&gt;
  
  
  Copilotレビューもプレミアムリクエストを使用しますか？
&lt;/h2&gt;

&lt;p&gt;現状では、Actions実行時間のみを消費します。レビュー担当者が使用するモデルはCopilotプラットフォームの一部であり、プレミアムリクエストとして個別に請求されません。ただし、この部分は今後変更される可能性があるため、GitHubの変更ログを確認してください。&lt;/p&gt;

&lt;p&gt;CIでCopilotレビューとモデルAPIの直接呼び出しの両方を実行しているチームは、&lt;a href="http://apidog.com/blog/how-to-use-gpt-5-5-free-codex?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;GPT-5.5無料Codexガイド&lt;/a&gt;でトークン単位のコストも確認してください。&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;を使うと、モックと契約レイヤーを先に通し、安価なチェックに成功したPRだけでAIレビューを実行できます。&lt;/p&gt;

</description>
      <category>api</category>
      <category>github</category>
      <category>githubcopilot</category>
      <category>management</category>
    </item>
    <item>
      <title>Zuplo API の使い方</title>
      <dc:creator>Akira</dc:creator>
      <pubDate>Mon, 27 Apr 2026 08:41:27 +0000</pubDate>
      <link>https://dev.to/aakira/zuplo-api-noshi-ifang-2pee</link>
      <guid>https://dev.to/aakira/zuplo-api-noshi-ifang-2pee</guid>
      <description>&lt;p&gt;Zuploについて調べて実際に何かをデプロイしてみたい開発者向けの実践ガイドです。このプラットフォームは学習が容易ですが、情報がポータル、CLI、ドキュメントに分散しています。この記事では、プロジェクト作成からルート公開、APIキー認証・レート制限追加、カスタムTypeScriptポリシー実装、エッジデプロイ、そしてApidogによるテストまで、必要な手順を網羅します。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;今すぐApidogを試す&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;最終的に、認証・レート制限・自動生成開発者ポータル・CIフレンドリーなGitワークフローを持つAPIゲートウェイが、オリジンサーバーの前段として完成します。このウォークスルー全体は約30分で完了します。&lt;/p&gt;

&lt;p&gt;Zuploが適切か迷う場合は、関連投稿「&lt;a href="http://apidog.com/blog/what-is-zuplo-api-gateway?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Zuplo APIゲートウェイとは&lt;/a&gt;」からご覧ください。エッジケースは&lt;a href="https://zuplo.com/docs" rel="noopener noreferrer"&gt;Zuploドキュメント&lt;/a&gt;を参照してください。&lt;/p&gt;

&lt;h2&gt;
  
  
  TL;DR
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;a href="https://portal.zuplo.com" rel="noopener noreferrer"&gt;portal.zuplo.com&lt;/a&gt;でサインアップするか、&lt;code&gt;npm create zuplo&lt;/code&gt;でローカルプロジェクトを作成&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;config/routes.oas.json&lt;/code&gt;でルートを定義し、URL Forward Handlerでオリジン転送&lt;/li&gt;
&lt;li&gt;ルートファイルまたはルートデザイナーでAPIキー認証・レート制限などのポリシー追加&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;modules/&lt;/code&gt;フォルダでTypeScriptでカスタムロジックを記述&lt;/li&gt;
&lt;li&gt;Gitブランチにプッシュしてプレビュー環境デプロイ、本番はマージで全世界エッジに配信&lt;/li&gt;
&lt;li&gt;本番昇格前に&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;で全ルートテスト&lt;/li&gt;
&lt;li&gt;10万リクエスト/月まで無料、ビルダープランは$25/月&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  前提条件
&lt;/h2&gt;

&lt;p&gt;始めるには以下が必要です。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Zuploアカウント&lt;/li&gt;
&lt;li&gt;オリジンAPI（無ければ &lt;code&gt;https://echo.zuplo.io&lt;/code&gt; 利用可）&lt;/li&gt;
&lt;li&gt;CLI利用時はNode.js 18以上&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;ローカル開発にはVS Code + TypeScript拡張機能推奨。&lt;a href="http://apidog.com/blog/how-to-use-apidog-inside-vscode?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog VS Code拡張&lt;/a&gt;を使うとエディタから直接リクエストを発行できます。&lt;/p&gt;

&lt;h2&gt;
  
  
  ステップ1：Zuploプロジェクトを作成する
&lt;/h2&gt;

&lt;h3&gt;
  
  
  オプションA：ポータル優先
&lt;/h3&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;a href="https://portal.zuplo.com" rel="noopener noreferrer"&gt;portal.zuplo.com&lt;/a&gt; にサインイン&lt;/li&gt;
&lt;li&gt;「New Project」→例: &lt;code&gt;acme-gateway&lt;/code&gt;
&lt;/li&gt;
&lt;li&gt;「Empty Project」を選択&lt;/li&gt;
&lt;li&gt;コードタブでファイルツリーを確認&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-232.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-232.png" alt="" width="800" height="404"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;ポータルはデフォルトでGitリポジトリにリンクされます。後からGitHub等を接続可能です。&lt;/p&gt;

&lt;h3&gt;
  
  
  オプションB：CLI優先
&lt;/h3&gt;

&lt;p&gt;CLIでローカルにプロジェクトを作成し、IDEで編集・即日Git運用可能です。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;npm create zuplo@latest &lt;span class="nt"&gt;--&lt;/span&gt; &lt;span class="nt"&gt;--name&lt;/span&gt; acme-gateway
&lt;span class="nb"&gt;cd &lt;/span&gt;acme-gateway
npm &lt;span class="nb"&gt;install
&lt;/span&gt;npm run dev
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;開発サーバーはポート9000、ルートデザイナーは &lt;a href="http://localhost:9100" rel="noopener noreferrer"&gt;http://localhost:9100&lt;/a&gt; で利用可能。ホットリロード対応。&lt;/p&gt;

&lt;p&gt;Zuploアカウントとリンクするには:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;npx zuplo &lt;span class="nb"&gt;link&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;プロンプトでアカウント・環境を選択し、&lt;code&gt;npx zuplo deploy&lt;/code&gt;でGitブランチをデプロイ。&lt;/p&gt;

&lt;h2&gt;
  
  
  ステップ2：最初のルートを定義する
&lt;/h2&gt;

&lt;p&gt;&lt;code&gt;config/routes.oas.json&lt;/code&gt; を編集し、例えば &lt;code&gt;GET /v1/products&lt;/code&gt; をオリジンに転送する設定例:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight json"&gt;&lt;code&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"openapi"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"3.1.0"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"info"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nl"&gt;"title"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"Acme Gateway"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nl"&gt;"version"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"1.0.0"&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"paths"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"/v1/products"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"get"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="nl"&gt;"summary"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"List products"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="nl"&gt;"operationId"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"list-products"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="nl"&gt;"x-zuplo-route"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"corsPolicy"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"anything-goes"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"handler"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
            &lt;/span&gt;&lt;span class="nl"&gt;"export"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"urlForwardHandler"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
            &lt;/span&gt;&lt;span class="nl"&gt;"module"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"$import(@zuplo/runtime)"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
            &lt;/span&gt;&lt;span class="nl"&gt;"options"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
              &lt;/span&gt;&lt;span class="nl"&gt;"baseUrl"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"${env.ORIGIN_URL}"&lt;/span&gt;&lt;span class="w"&gt;
            &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"policies"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nl"&gt;"inbound"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;[]&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="nl"&gt;"responses"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"200"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nl"&gt;"description"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"Success"&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;ul&gt;
&lt;li&gt;
&lt;code&gt;x-zuplo-route&lt;/code&gt;でZuplo拡張を指定&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;handler&lt;/code&gt;に &lt;code&gt;urlForwardHandler&lt;/code&gt;（組み込みプロキシ）&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;${env.ORIGIN_URL}&lt;/code&gt; は環境変数から取得&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;code&gt;ORIGIN_URL&lt;/code&gt;はポータル設定または &lt;code&gt;config/.env&lt;/code&gt; で設定。無ければ &lt;code&gt;https://echo.zuplo.io&lt;/code&gt; を指定。&lt;/p&gt;

&lt;p&gt;保存後、&lt;code&gt;http://localhost:9000/v1/products&lt;/code&gt; でリクエストを確認。&lt;/p&gt;

&lt;h2&gt;
  
  
  ステップ3：APIキー認証を追加する
&lt;/h2&gt;

&lt;p&gt;API公開には認証必須。ZuploのマネージドAPIキーサービスを利用します。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;ルートの &lt;code&gt;policies.inbound&lt;/code&gt; に &lt;code&gt;"api-key-auth"&lt;/code&gt; を追加
&lt;/li&gt;
&lt;/ol&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight json"&gt;&lt;code&gt;&lt;span class="nl"&gt;"policies"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"inbound"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="s2"&gt;"api-key-auth"&lt;/span&gt;&lt;span class="p"&gt;]&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;ol&gt;
&lt;li&gt;
&lt;code&gt;config/policies.json&lt;/code&gt; にポリシーを定義
&lt;/li&gt;
&lt;/ol&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight json"&gt;&lt;code&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"name"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"api-key-auth"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"policyType"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"api-key-inbound"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"handler"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"export"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"ApiKeyInboundPolicy"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"module"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"$import(@zuplo/runtime)"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"options"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"allowUnauthenticatedRequests"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="kc"&gt;false&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;ol&gt;
&lt;li&gt;&lt;p&gt;ポータル「Services &amp;gt; API Key Service」でConsumer作成 → APIキー発行&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;テスト（ヘッダー無しで401, ヘッダー有りで200）&lt;br&gt;
&lt;/p&gt;&lt;/li&gt;
&lt;/ol&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;curl &lt;span class="nt"&gt;-i&lt;/span&gt; https://YOUR-PROJECT.zuplo.app/v1/products
&lt;span class="c"&gt;# HTTP/2 401&lt;/span&gt;

curl &lt;span class="nt"&gt;-i&lt;/span&gt; https://YOUR-PROJECT.zuplo.app/v1/products &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;-H&lt;/span&gt; &lt;span class="s2"&gt;"Authorization: Bearer YOUR_API_KEY"&lt;/span&gt;
&lt;span class="c"&gt;# HTTP/2 200&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;クライアントテストは&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;にOpenAPIスペックをインポートし、グローバルヘッダー &lt;code&gt;Authorization: Bearer {{api_key}}&lt;/code&gt; を追加するのが効率的です。&lt;/p&gt;

&lt;h2&gt;
  
  
  ステップ4：ルートのレート制限
&lt;/h2&gt;

&lt;p&gt;公開APIは必ずレート制限を設定しましょう。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;code&gt;policies.inbound&lt;/code&gt;にレート制限を追加
&lt;/li&gt;
&lt;/ol&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight json"&gt;&lt;code&gt;&lt;span class="nl"&gt;"policies"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"inbound"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="s2"&gt;"api-key-auth"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"rate-limit-by-key"&lt;/span&gt;&lt;span class="p"&gt;]&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;ol&gt;
&lt;li&gt;
&lt;code&gt;config/policies.json&lt;/code&gt; に定義
&lt;/li&gt;
&lt;/ol&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight json"&gt;&lt;code&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"name"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"rate-limit-by-key"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"policyType"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"rate-limit-inbound"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"handler"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"export"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"RateLimitInboundPolicy"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"module"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"$import(@zuplo/runtime)"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"options"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"rateLimitBy"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"sub"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"requestsAllowed"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="mi"&gt;60&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"timeWindowMinutes"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="mi"&gt;1&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;ul&gt;
&lt;li&gt;
&lt;code&gt;rateLimitBy: "sub"&lt;/code&gt;でAPIキーごとに60リクエスト/分&lt;/li&gt;
&lt;li&gt;匿名制限は &lt;code&gt;"ip"&lt;/code&gt; に変更&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;テスト例（70リクエスト中、60回200、10回429）:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;&lt;span class="k"&gt;for &lt;/span&gt;i &lt;span class="k"&gt;in&lt;/span&gt; &lt;span class="o"&gt;{&lt;/span&gt;1..70&lt;span class="o"&gt;}&lt;/span&gt;&lt;span class="p"&gt;;&lt;/span&gt; &lt;span class="k"&gt;do
  &lt;/span&gt;curl &lt;span class="nt"&gt;-s&lt;/span&gt; &lt;span class="nt"&gt;-o&lt;/span&gt; /dev/null &lt;span class="nt"&gt;-w&lt;/span&gt; &lt;span class="s2"&gt;"%{http_code}&lt;/span&gt;&lt;span class="se"&gt;\n&lt;/span&gt;&lt;span class="s2"&gt;"&lt;/span&gt; &lt;span class="se"&gt;\&lt;/span&gt;
    https://YOUR-PROJECT.zuplo.app/v1/products &lt;span class="se"&gt;\&lt;/span&gt;
    &lt;span class="nt"&gt;-H&lt;/span&gt; &lt;span class="s2"&gt;"Authorization: Bearer YOUR_API_KEY"&lt;/span&gt;
&lt;span class="k"&gt;done&lt;/span&gt; | &lt;span class="nb"&gt;sort&lt;/span&gt; | &lt;span class="nb"&gt;uniq&lt;/span&gt; &lt;span class="nt"&gt;-c&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h2&gt;
  
  
  ステップ5：リクエストペイロードを検証する
&lt;/h2&gt;

&lt;p&gt;OpenAPIのJSON Schemaを活用し、リクエストバリデーションをゲートウェイで実施します。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;code&gt;POST /v1/products&lt;/code&gt; の例：
&lt;/li&gt;
&lt;/ol&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight json"&gt;&lt;code&gt;&lt;span class="nl"&gt;"/v1/products"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"post"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"summary"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"Create product"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"operationId"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"create-product"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"requestBody"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"required"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="kc"&gt;true&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"content"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="nl"&gt;"application/json"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"schema"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
            &lt;/span&gt;&lt;span class="nl"&gt;"type"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"object"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
            &lt;/span&gt;&lt;span class="nl"&gt;"required"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="s2"&gt;"name"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"priceCents"&lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt;&lt;span class="w"&gt;
            &lt;/span&gt;&lt;span class="nl"&gt;"properties"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
              &lt;/span&gt;&lt;span class="nl"&gt;"name"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nl"&gt;"type"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"string"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nl"&gt;"minLength"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="mi"&gt;1&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;&lt;span class="w"&gt;
              &lt;/span&gt;&lt;span class="nl"&gt;"priceCents"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nl"&gt;"type"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"integer"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nl"&gt;"minimum"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="mi"&gt;1&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;&lt;span class="w"&gt;
              &lt;/span&gt;&lt;span class="nl"&gt;"category"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nl"&gt;"type"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"string"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nl"&gt;"enum"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="s2"&gt;"food"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"drink"&lt;/span&gt;&lt;span class="p"&gt;]&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
            &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"x-zuplo-route"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"handler"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="err"&gt;/*&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="err"&gt;省略&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="err"&gt;*/&lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"policies"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="nl"&gt;"inbound"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="s2"&gt;"api-key-auth"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="s2"&gt;"rate-limit-by-key"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="s2"&gt;"validate-request"&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="p"&gt;]&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;ol&gt;
&lt;li&gt;
&lt;code&gt;policies.json&lt;/code&gt; に追加
&lt;/li&gt;
&lt;/ol&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight json"&gt;&lt;code&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"name"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"validate-request"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"policyType"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"open-api-request-validation-inbound"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"handler"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"export"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"OpenApiRequestValidationInboundPolicy"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"module"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"$import(@zuplo/runtime)"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"options"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"validateBody"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"reject"&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;必須フィールド欠落や不正値で400応答。Apidogを使った正常・異常リクエストのグループテスト推奨。&lt;/p&gt;

&lt;h2&gt;
  
  
  ステップ6：カスタムTypeScriptポリシーを記述する
&lt;/h2&gt;

&lt;p&gt;ビルトインポリシーで足りない場合は、TypeScriptで拡張可能。例：有料プランは &lt;code&gt;Cache-Control&lt;/code&gt; 付与、無料は &lt;code&gt;no-store&lt;/code&gt;。&lt;/p&gt;

&lt;p&gt;&lt;code&gt;modules/tiered-cache.ts&lt;/code&gt;:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight typescript"&gt;&lt;code&gt;&lt;span class="k"&gt;import&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt; &lt;span class="nx"&gt;ZuploRequest&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="nx"&gt;ZuploContext&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="nx"&gt;HttpProblems&lt;/span&gt; &lt;span class="p"&gt;}&lt;/span&gt; &lt;span class="k"&gt;from&lt;/span&gt; &lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;@zuplo/runtime&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="p"&gt;;&lt;/span&gt;

&lt;span class="kr"&gt;interface&lt;/span&gt; &lt;span class="nx"&gt;PolicyOptions&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
  &lt;span class="nl"&gt;paidPlanHeader&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="kr"&gt;string&lt;/span&gt;&lt;span class="p"&gt;;&lt;/span&gt;
  &lt;span class="nl"&gt;paidMaxAge&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="kr"&gt;number&lt;/span&gt;&lt;span class="p"&gt;;&lt;/span&gt;
&lt;span class="p"&gt;}&lt;/span&gt;

&lt;span class="k"&gt;export&lt;/span&gt; &lt;span class="k"&gt;default&lt;/span&gt; &lt;span class="k"&gt;async&lt;/span&gt; &lt;span class="nf"&gt;function &lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
  &lt;span class="nx"&gt;response&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="nx"&gt;Response&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
  &lt;span class="nx"&gt;request&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="nx"&gt;ZuploRequest&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
  &lt;span class="nx"&gt;context&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="nx"&gt;ZuploContext&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
  &lt;span class="nx"&gt;options&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="nx"&gt;PolicyOptions&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;span class="p"&gt;):&lt;/span&gt; &lt;span class="nb"&gt;Promise&lt;/span&gt;&lt;span class="o"&gt;&amp;lt;&lt;/span&gt;&lt;span class="nx"&gt;Response&lt;/span&gt;&lt;span class="o"&gt;&amp;gt;&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
  &lt;span class="kd"&gt;const&lt;/span&gt; &lt;span class="nx"&gt;plan&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="nx"&gt;request&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;user&lt;/span&gt;&lt;span class="p"&gt;?.&lt;/span&gt;&lt;span class="nx"&gt;data&lt;/span&gt;&lt;span class="p"&gt;?.&lt;/span&gt;&lt;span class="nx"&gt;plan&lt;/span&gt; &lt;span class="o"&gt;??&lt;/span&gt; &lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;free&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="p"&gt;;&lt;/span&gt;

  &lt;span class="k"&gt;if &lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="nx"&gt;plan&lt;/span&gt; &lt;span class="o"&gt;===&lt;/span&gt; &lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;free&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
    &lt;span class="nx"&gt;response&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;headers&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;set&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;Cache-Control&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;no-store&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="p"&gt;);&lt;/span&gt;
  &lt;span class="p"&gt;}&lt;/span&gt; &lt;span class="k"&gt;else&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
    &lt;span class="nx"&gt;response&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;headers&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;set&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
      &lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;Cache-Control&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
      &lt;span class="s2"&gt;`public, max-age=&lt;/span&gt;&lt;span class="p"&gt;${&lt;/span&gt;&lt;span class="nx"&gt;options&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;paidMaxAge&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="s2"&gt;`&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="p"&gt;);&lt;/span&gt;
  &lt;span class="p"&gt;}&lt;/span&gt;

  &lt;span class="nx"&gt;context&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;log&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;info&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="s2"&gt;`Cache header set for plan=&lt;/span&gt;&lt;span class="p"&gt;${&lt;/span&gt;&lt;span class="nx"&gt;plan&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="s2"&gt;`&lt;/span&gt;&lt;span class="p"&gt;);&lt;/span&gt;
  &lt;span class="k"&gt;return&lt;/span&gt; &lt;span class="nx"&gt;response&lt;/span&gt;&lt;span class="p"&gt;;&lt;/span&gt;
&lt;span class="p"&gt;}&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;code&gt;policies.json&lt;/code&gt; に登録:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight json"&gt;&lt;code&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"name"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"tiered-cache"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"policyType"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"custom-code-outbound"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"handler"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"export"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"default"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"module"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"$import(./modules/tiered-cache)"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"options"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"paidPlanHeader"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"x-plan"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"paidMaxAge"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="mi"&gt;300&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;ルートで参照：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight json"&gt;&lt;code&gt;&lt;span class="nl"&gt;"policies"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"inbound"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="s2"&gt;"api-key-auth"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"rate-limit-by-key"&lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"outbound"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="s2"&gt;"tiered-cache"&lt;/span&gt;&lt;span class="p"&gt;]&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;関数ベースなのでVitest/Jestで単体テスト可能です。&lt;/p&gt;

&lt;h2&gt;
  
  
  ステップ7：エッジにデプロイする
&lt;/h2&gt;

&lt;p&gt;デプロイはGit操作で完結。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;git add &lt;span class="nb"&gt;.&lt;/span&gt;
git commit &lt;span class="nt"&gt;-m&lt;/span&gt; &lt;span class="s2"&gt;"Add products gateway with auth, rate limit, and tiered cache"&lt;/span&gt;
git push origin feature/products-gateway
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;各ブランチごとにプレビュー環境がURL付きでビルドされます（例: &lt;code&gt;https://acme-gateway-feature-products-gateway-abc123.zuplo.app&lt;/code&gt;）。&lt;/p&gt;

&lt;p&gt;&lt;code&gt;Apidog&lt;/code&gt;でプレビュー環境をフルテスト→OKならマージで本番ロールアウト:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;git checkout main
git merge feature/products-gateway
git push origin main
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;60秒以内に全エッジで新バージョン稼働。ロールバックも &lt;code&gt;git revert&lt;/code&gt; だけでOK。&lt;/p&gt;

&lt;h2&gt;
  
  
  ステップ8：開発者ポータルを生成する
&lt;/h2&gt;

&lt;p&gt;自動生成ポータルは &lt;code&gt;https://YOUR-PROJECT.developers.zuplo.com&lt;/code&gt; で公開。特長:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;各ルートごとにページ＋Tryコンソール&lt;/li&gt;
&lt;li&gt;cURL/JS/Python/Go等のコードサンプル&lt;/li&gt;
&lt;li&gt;APIキーのセルフサービス発行&lt;/li&gt;
&lt;li&gt;Next.jsベースのカスタマイズ可能ソース（&lt;a href="https://github.com/zuplo/zudoku" rel="noopener noreferrer"&gt;GitHubリポジトリ&lt;/a&gt;）&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;OpenAPIに説明・例があれば即完成度高いポータルとなります。&lt;/p&gt;

&lt;h2&gt;
  
  
  ステップ9：Apidogですべてをテストする
&lt;/h2&gt;

&lt;p&gt;本番事故を防ぐには、全ルート・全ポリシー・全エラーパスの自動テストが不可欠。&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;が迅速に実現します。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-233.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-233.png" alt="" width="800" height="530"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;おすすめワークフロー:&lt;/strong&gt;&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;code&gt;https://YOUR-PROJECT.zuplo.app/openapi&lt;/code&gt; からOpenAPI仕様をインポート&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;local&lt;/code&gt;/&lt;code&gt;preview&lt;/code&gt;/&lt;code&gt;production&lt;/code&gt; 環境ごとに &lt;code&gt;base_url&lt;/code&gt;・&lt;code&gt;api_key&lt;/code&gt; を設定&lt;/li&gt;
&lt;li&gt;各ルートごとに正常/認証失敗/レート制限のリクエストを保存し、グループ実行&lt;/li&gt;
&lt;li&gt;Apidog自動テストでシナリオ連結・応答shapeチェック&lt;/li&gt;
&lt;li&gt;必要ならコードスニペットをチームの主要言語で生成&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;Postmanからの移行は&lt;a href="http://apidog.com/blog/api-testing-without-postman-2026?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;APIテストガイド&lt;/a&gt;参照。&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidogダウンロード&lt;/a&gt;も活用ください。&lt;/p&gt;

&lt;h2&gt;
  
  
  Zuploの使用に関するよくある質問
&lt;/h2&gt;

&lt;h3&gt;
  
  
  仕様を変更せずに、環境間でルートを切り替えるには？
&lt;/h3&gt;

&lt;p&gt;環境変数&lt;code&gt;ORIGIN_URL&lt;/code&gt;を各環境で設定し、ハンドラーで&lt;code&gt;${env.ORIGIN_URL}&lt;/code&gt;参照。ルート定義はそのままでOK。&lt;/p&gt;

&lt;h3&gt;
  
  
  Zuploをオフラインで実行できますか？
&lt;/h3&gt;

&lt;p&gt;&lt;code&gt;npm run dev&lt;/code&gt; でローカルゲートウェイ・デザイナー起動。カスタムポリシー等もローカルで動作。APIキー管理のみクラウド接続が必要で、&lt;code&gt;npx zuplo link&lt;/code&gt;で利用可能。&lt;/p&gt;

&lt;h3&gt;
  
  
  不正なデプロイをロールバックするには？
&lt;/h3&gt;

&lt;p&gt;&lt;code&gt;git revert&lt;/code&gt; → pushでOK。Git履歴が唯一のソース。&lt;/p&gt;

&lt;h3&gt;
  
  
  デプロイ中のリクエストは？
&lt;/h3&gt;

&lt;p&gt;エッジでアトミックに切り替わるため、進行中のリクエストは旧バージョンで完結。ダウンタイムなし。&lt;/p&gt;

&lt;h3&gt;
  
  
  gRPCやWebSocketsサポートは？
&lt;/h3&gt;

&lt;p&gt;&lt;code&gt;urlForwardHandler&lt;/code&gt;でWebSocket透過プロキシ。gRPCも専用ハンドラー対応。REST/GraphQLがファーストクラス。&lt;/p&gt;

&lt;h3&gt;
  
  
  Zuplo APIをAIエージェント向けに公開できますか？
&lt;/h3&gt;

&lt;p&gt;MCPサーバーハンドラー追加＆OpenAPI指定で対応。認証・レート制限も適用。詳細は&lt;a href="https://zuplo.com/docs/mcp-server/introduction" rel="noopener noreferrer"&gt;Zuplo MCPサーバードキュメント&lt;/a&gt;。&lt;/p&gt;

&lt;h3&gt;
  
  
  本番料金は？
&lt;/h3&gt;

&lt;p&gt;無料は月10万リクエスト、ビルダープラン$25/月で100万リクエスト追加、超過は10万ごと$100。エンタープライズは月$1,000～。詳しくは&lt;a href="https://zuplo.com/pricing" rel="noopener noreferrer"&gt;料金ページ&lt;/a&gt;。&lt;/p&gt;

&lt;h2&gt;
  
  
  結論
&lt;/h2&gt;

&lt;p&gt;これで、APIキー認証・レート制限・リクエスト検証・カスタムTypeScriptポリシー・開発者ポータル・Gitベースエッジデプロイが可能なZuploゲートウェイの実装が完了です。プレビュー環境、本番ロールアウト、AIエージェント向け公開も同じプロジェクトで管理できます。&lt;/p&gt;

&lt;p&gt;安定運用の鍵はテストループです。すべてのプレビュー環境に&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;でテストを実施し、認証・スキーマ・レート制限ミスを本番前に発見しましょう。&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidogをダウンロード&lt;/a&gt;して、今すぐゲートウェイに組み込んでください。&lt;/p&gt;

</description>
    </item>
    <item>
      <title>Zuplo APIゲートウェイとは？</title>
      <dc:creator>Akira</dc:creator>
      <pubDate>Mon, 27 Apr 2026 06:26:40 +0000</pubDate>
      <link>https://dev.to/aakira/zuplo-apigetoueitoha-4cdn</link>
      <guid>https://dev.to/aakira/zuplo-apigetoueitoha-4cdn</guid>
      <description>&lt;p&gt;ほとんどのAPIゲートウェイは、2014年の運用チーム向けに設計されたようなアプローチが一般的です。YAML編集、複雑なコントロールプレーン、クラスター権限者によるデプロイ待ち……。Zuploはこの仕組みを刷新し、エッジネイティブかつプログラマブルなAPIゲートウェイとして、Gitベースのルーティング、TypeScriptポリシー、数秒でのグローバルデプロイを実現します。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;今すぐApidogを試す&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;このガイドでは、Zuploの特徴、KongやAWS API Gatewayとの違い、価格、30分以内で最初のゲートウェイを出荷するハンズオン手順、コード例（ルーティング・認証・レート制限）、さらには本番前に&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;でエンドポイントテストを自動化する方法まで、実践的に解説します。&lt;/p&gt;

&lt;h2&gt;
  
  
  まとめ（TL;DR）
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;ZuploはCloudflare 300+拠点で稼働する完全マネージド・エッジネイティブAPIゲートウェイ。サブ50msのレイテンシ、コールドスタートなし。&lt;/li&gt;
&lt;li&gt;GitOpsネイティブ：構成はGitリポジトリに保管、デプロイもCI/CD経由。&lt;/li&gt;
&lt;li&gt;ポリシーはTypeScript記述、IDEの型・補完・テストにフル対応。&lt;/li&gt;
&lt;li&gt;無料プランで月10万リクエスト、無制限環境・APIキー・開発者ポータル付き。&lt;/li&gt;
&lt;li&gt;APIキー認証/JWT/OAuth2/レート制限/リクエスト検証/自動生成開発者ポータル/Stripe収益化を標準装備。&lt;/li&gt;
&lt;li&gt;MCPサーバーハンドラーでClaudeやCodexなどMCPクライアントからAPI公開可。&lt;/li&gt;
&lt;li&gt;本番前に&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;で全ルートのE2Eテストが推奨されています。&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  Zuploとは？
&lt;/h2&gt;

&lt;p&gt;&lt;a href="https://zuplo.com/docs/api-management/introduction" rel="noopener noreferrer"&gt;Zuplo&lt;/a&gt;は「設定よりコード」「地域よりエッジ」「GUIよりGit」を掲げるAPI管理プラットフォーム。Cloudflareエッジ上で完全マネージドサービスとして動作し、1回のデプロイで300ヶ所に展開。プロビジョニング不要です。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F06t6wd5qu6bick3ihqgi.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F06t6wd5qu6bick3ihqgi.png" alt="Zuploの概要図" width="800" height="352"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;従来のゲートウェイがYAMLアーティファクトをDB管理するのに対し、ZuploはTypeScriptプロジェクトとして構築します。エンドポイント定義（&lt;code&gt;routes.oas.json&lt;/code&gt;）、TypeScriptロジック用モジュール、ポリシー設定ファイルをGitHubへpushすれば、ビルド・検証・デプロイが自動実行されます。&lt;/p&gt;

&lt;p&gt;REST/GraphQL/gRPC/WebSockets/SOAPサポート、SOC 2 Type II対応、AWS/Azure/GCPバックエンド、自己ホスト型Kubernetesも選択可能。無料スタートで、従量課金制。詳細は&lt;a href="https://zuplo.com/pricing" rel="noopener noreferrer"&gt;料金ページ&lt;/a&gt;を参照。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fchc3a093df7p7muegdtm.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fchc3a093df7p7muegdtm.png" alt="Zuplo ダッシュボードのスクリーンショット" width="800" height="605"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  開発者がKong、Apigee、AWS API GatewayよりもZuploを選ぶ理由
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Kong&lt;/strong&gt;: 高い制御力とLua要件のOSS。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Apigee&lt;/strong&gt;: 高機能だが学習コスト大のエンタープライズ向け。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;AWS API Gateway&lt;/strong&gt;: AWSスタック向けだが開発者ポータル無し・Lambda統合時のコールドスタートがコスト増大。&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;Zuplo&lt;/strong&gt;は、プラットフォームエンジニア不要でエンタープライズ機能が手軽に欲しい小規模～中規模開発者チームがターゲット。&lt;/p&gt;

&lt;p&gt;主な違いと実装ポイント:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;YAML不要、TypeScriptによるポリシー実装&lt;/strong&gt;

&lt;ul&gt;
&lt;li&gt;レート制限ポリシー例: ZuploはTypeScript3行、KongはYAML+プラグインで15行以上。&lt;/li&gt;
&lt;/ul&gt;


&lt;/li&gt;

&lt;li&gt;

&lt;strong&gt;全プランで開発者ポータル自動生成&lt;/strong&gt;

&lt;ul&gt;
&lt;li&gt;OpenAPI仕様から即座にブランド化、セルフサービスAPIキー発行可。&lt;/li&gt;
&lt;/ul&gt;


&lt;/li&gt;

&lt;li&gt;

&lt;strong&gt;デフォルトでGitOps&lt;/strong&gt;

&lt;ul&gt;
&lt;li&gt;すべての変更がPR経由。レビュー・監査・revert容易。UIクリック追跡は不要。&lt;/li&gt;
&lt;/ul&gt;


&lt;/li&gt;

&lt;li&gt;

&lt;strong&gt;Cloudflareエッジ実行、コールドスタートなし&lt;/strong&gt;

&lt;ul&gt;
&lt;li&gt;近接データセンターで即時レスポンス。Lambda統合だと常時100-800ms追加レイテンシ。&lt;/li&gt;
&lt;/ul&gt;


&lt;/li&gt;

&lt;/ul&gt;

&lt;p&gt;既存投資や運用負荷問題がなければ無理に乗り換える必要はありませんが、新規選定や現行ゲートウェイに課題があれば、Zuploのワークフローは大幅な効率化を提供します。&lt;/p&gt;

&lt;h2&gt;
  
  
  Zuplo APIゲートウェイの主要機能
&lt;/h2&gt;

&lt;h3&gt;
  
  
  TypeScriptファーストのプログラマビリティ
&lt;/h3&gt;

&lt;p&gt;ルート直下のTypeScriptファイルで動作を記述。カスタムインバウンド／アウトバウンドポリシーはシンプルな非同期関数。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;例: 内部ヘッダー削除のアウトバウンドポリシー&lt;/strong&gt;&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight typescript"&gt;&lt;code&gt;&lt;span class="k"&gt;import&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt; &lt;span class="nx"&gt;ZuploRequest&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="nx"&gt;ZuploContext&lt;/span&gt; &lt;span class="p"&gt;}&lt;/span&gt; &lt;span class="k"&gt;from&lt;/span&gt; &lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;@zuplo/runtime&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="p"&gt;;&lt;/span&gt;

&lt;span class="k"&gt;export&lt;/span&gt; &lt;span class="k"&gt;default&lt;/span&gt; &lt;span class="k"&gt;async&lt;/span&gt; &lt;span class="nf"&gt;function &lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
  &lt;span class="nx"&gt;response&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="nx"&gt;Response&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
  &lt;span class="nx"&gt;request&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="nx"&gt;ZuploRequest&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
  &lt;span class="nx"&gt;context&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="nx"&gt;ZuploContext&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;span class="p"&gt;)&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
  &lt;span class="nx"&gt;response&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;headers&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="k"&gt;delete&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;x-internal-trace-id&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="p"&gt;);&lt;/span&gt;
  &lt;span class="k"&gt;return&lt;/span&gt; &lt;span class="nx"&gt;response&lt;/span&gt;&lt;span class="p"&gt;;&lt;/span&gt;
&lt;span class="p"&gt;}&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;このファイルを&lt;code&gt;modules/strip-internal-header.ts&lt;/code&gt;に配置し、ルートで参照→Gitへpushで即デプロイ。&lt;/p&gt;

&lt;h3&gt;
  
  
  60+ プリビルドポリシー
&lt;/h3&gt;

&lt;p&gt;APIキー認証/JWT/OAuth2/レート制限（各種アルゴリズム）/OpenAPIスキーマ検証/CORS/IP許可リスト/リクエスト変換等、標準化された機能セットをJSONブロック追加のみで導入可。標準ケースはコード不要。&lt;/p&gt;

&lt;h3&gt;
  
  
  自動生成開発者ポータル
&lt;/h3&gt;

&lt;p&gt;OpenAPI指定で、試用コンソール、各種言語コードサンプル、セルフサービスAPIキー発行機能付きのドキュメントサイトを即生成。SaaS API新規開発時の採用効率UP。&lt;/p&gt;

&lt;h3&gt;
  
  
  Stripe連携API収益化
&lt;/h3&gt;

&lt;p&gt;無料/有料/エンタープライズ等、プラン定義＋Stripe連携で、ポータルがサブスク管理や従量課金を自動化。API経由課金を簡単に実現。&lt;/p&gt;

&lt;h3&gt;
  
  
  AIエージェント用MCPサーバーハンドラー
&lt;/h3&gt;

&lt;p&gt;OpenAPI仕様を指定し、公開操作を選択するだけで、Claude/Codex/Cursor等MCP互換AIクライアントからAPI呼出可能。認証・レート制限も共通適用。&lt;/p&gt;

&lt;p&gt;詳細なウォークスルーは&lt;a href="https://zuplo.com/docs/mcp-server/introduction" rel="noopener noreferrer"&gt;公式ドキュメント&lt;/a&gt;参照。&lt;/p&gt;

&lt;h3&gt;
  
  
  エッジデプロイ・50ms以下のレイテンシ
&lt;/h3&gt;

&lt;p&gt;Cloudflareエッジ300拠点に自動デプロイ。設定不要・デフォルトでエッジ。リージョン選択不要で各拠点の近接性を最大限利用。&lt;/p&gt;

&lt;h2&gt;
  
  
  Zuploの仕組み
&lt;/h2&gt;

&lt;p&gt;リクエストは最寄りエッジで以下のパイプラインを通過：&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;ルートマッチ&lt;/strong&gt;: リクエストURL＋メソッドで&lt;code&gt;routes.oas.json&lt;/code&gt;照合、ハンドラー決定。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;インバウンドポリシー&lt;/strong&gt;: APIキー認証/JWT検証/レート制限/スキーマ検証等が逐次実行。エラー時は即レスポンス。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;ハンドラー&lt;/strong&gt;: アップストリームプロキシ／静的値／TypeScript／MCPサーバーハンドラー等。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;アウトバウンドポリシー&lt;/strong&gt;: レスポンス変換・ヘッダー削除等。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;レスポンス&lt;/strong&gt;: クライアント返却＋ログ/メトリクス送信。&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;全てCloudflare Workerで高速処理、アイドルコスト不要。&lt;/p&gt;

&lt;h2&gt;
  
  
  最初のZuploゲートウェイ構築（30分ハンズオン）
&lt;/h2&gt;

&lt;ol&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;サインアップとプロジェクト作成&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
&lt;a href="https://zuplo.com" rel="noopener noreferrer"&gt;zuplo.com&lt;/a&gt;でサインアップ→新規プロジェクト→GitHub連携でリポジトリ同期。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;OpenAPI仕様のインポート&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
仕様をインポート（未作成時はUIでルート作成→後からエクスポートも可）。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;APIキー認証追加&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
ルートエディターで&lt;code&gt;api-key-inbound&lt;/code&gt;ポリシーを追加、キー発行UIも自動生成。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;レート制限追加&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
&lt;code&gt;rate-limit-inbound&lt;/code&gt;ポリシーを追加し、例：APIキー毎に1分100リクエスト等を設定（JSONで1ブロック記述）。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;デプロイ&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
ブランチへpushでプレビュー環境生成、本番昇格はマージで。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;E2Eテスト&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;で新ゲートウェイURLに対し、正/誤APIキー、レート超過、不正ペイロードなど多様なケースを即時テスト。視覚的なレスポンス確認でポリシー適用を検証。&lt;/p&gt;&lt;/li&gt;
&lt;/ol&gt;

&lt;h2&gt;
  
  
  TypeScriptでのカスタムポリシー実装例
&lt;/h2&gt;

&lt;p&gt;プリビルドで足りない場合は、TypeScriptで柔軟にカスタムポリシー追加。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;例：ユーザー情報を内部サービスで補足しリクエストに付加&lt;/strong&gt;&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight typescript"&gt;&lt;code&gt;&lt;span class="k"&gt;import&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt; &lt;span class="nx"&gt;ZuploRequest&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="nx"&gt;ZuploContext&lt;/span&gt; &lt;span class="p"&gt;}&lt;/span&gt; &lt;span class="k"&gt;from&lt;/span&gt; &lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;@zuplo/runtime&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="p"&gt;;&lt;/span&gt;

&lt;span class="kr"&gt;interface&lt;/span&gt; &lt;span class="nx"&gt;UserContext&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
  &lt;span class="nl"&gt;userId&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="kr"&gt;string&lt;/span&gt;&lt;span class="p"&gt;;&lt;/span&gt;
  &lt;span class="nl"&gt;plan&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;free&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt; &lt;span class="o"&gt;|&lt;/span&gt; &lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;pro&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt; &lt;span class="o"&gt;|&lt;/span&gt; &lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;enterprise&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="p"&gt;;&lt;/span&gt;
&lt;span class="p"&gt;}&lt;/span&gt;

&lt;span class="k"&gt;export&lt;/span&gt; &lt;span class="k"&gt;default&lt;/span&gt; &lt;span class="k"&gt;async&lt;/span&gt; &lt;span class="nf"&gt;function &lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
  &lt;span class="nx"&gt;request&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="nx"&gt;ZuploRequest&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
  &lt;span class="nx"&gt;context&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="nx"&gt;ZuploContext&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;span class="p"&gt;):&lt;/span&gt; &lt;span class="nb"&gt;Promise&lt;/span&gt;&lt;span class="o"&gt;&amp;lt;&lt;/span&gt;&lt;span class="nx"&gt;ZuploRequest&lt;/span&gt; &lt;span class="o"&gt;|&lt;/span&gt; &lt;span class="nx"&gt;Response&lt;/span&gt;&lt;span class="o"&gt;&amp;gt;&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
  &lt;span class="kd"&gt;const&lt;/span&gt; &lt;span class="nx"&gt;apiKey&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="nx"&gt;request&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;user&lt;/span&gt;&lt;span class="p"&gt;?.&lt;/span&gt;&lt;span class="nx"&gt;sub&lt;/span&gt;&lt;span class="p"&gt;;&lt;/span&gt;
  &lt;span class="k"&gt;if &lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="o"&gt;!&lt;/span&gt;&lt;span class="nx"&gt;apiKey&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
    &lt;span class="k"&gt;return&lt;/span&gt; &lt;span class="k"&gt;new&lt;/span&gt; &lt;span class="nc"&gt;Response&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;Unauthorized&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt; &lt;span class="na"&gt;status&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="mi"&gt;401&lt;/span&gt; &lt;span class="p"&gt;});&lt;/span&gt;
  &lt;span class="p"&gt;}&lt;/span&gt;

  &lt;span class="kd"&gt;const&lt;/span&gt; &lt;span class="nx"&gt;lookupUrl&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="s2"&gt;`https://internal.example.com/users/&lt;/span&gt;&lt;span class="p"&gt;${&lt;/span&gt;&lt;span class="nx"&gt;apiKey&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="s2"&gt;`&lt;/span&gt;&lt;span class="p"&gt;;&lt;/span&gt;
  &lt;span class="kd"&gt;const&lt;/span&gt; &lt;span class="nx"&gt;userResponse&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="k"&gt;await&lt;/span&gt; &lt;span class="nf"&gt;fetch&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="nx"&gt;lookupUrl&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
    &lt;span class="na"&gt;headers&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt; &lt;span class="na"&gt;authorization&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="s2"&gt;`Bearer &lt;/span&gt;&lt;span class="p"&gt;${&lt;/span&gt;&lt;span class="nx"&gt;context&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;environment&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;INTERNAL_TOKEN&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="s2"&gt;`&lt;/span&gt; &lt;span class="p"&gt;},&lt;/span&gt;
  &lt;span class="p"&gt;});&lt;/span&gt;

  &lt;span class="k"&gt;if &lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="o"&gt;!&lt;/span&gt;&lt;span class="nx"&gt;userResponse&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;ok&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
    &lt;span class="k"&gt;return&lt;/span&gt; &lt;span class="k"&gt;new&lt;/span&gt; &lt;span class="nc"&gt;Response&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;User lookup failed&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt; &lt;span class="na"&gt;status&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="mi"&gt;502&lt;/span&gt; &lt;span class="p"&gt;});&lt;/span&gt;
  &lt;span class="p"&gt;}&lt;/span&gt;

  &lt;span class="kd"&gt;const&lt;/span&gt; &lt;span class="nx"&gt;user&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="k"&gt;await&lt;/span&gt; &lt;span class="nx"&gt;userResponse&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;json&lt;/span&gt;&lt;span class="p"&gt;())&lt;/span&gt; &lt;span class="k"&gt;as&lt;/span&gt; &lt;span class="nx"&gt;UserContext&lt;/span&gt;&lt;span class="p"&gt;;&lt;/span&gt;
  &lt;span class="nx"&gt;request&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;headers&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;set&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;x-user-id&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="nx"&gt;user&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;userId&lt;/span&gt;&lt;span class="p"&gt;);&lt;/span&gt;
  &lt;span class="nx"&gt;request&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;headers&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;set&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;x-user-plan&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="nx"&gt;user&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;plan&lt;/span&gt;&lt;span class="p"&gt;);&lt;/span&gt;
  &lt;span class="k"&gt;return&lt;/span&gt; &lt;span class="nx"&gt;request&lt;/span&gt;&lt;span class="p"&gt;;&lt;/span&gt;
&lt;span class="p"&gt;}&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;ポイント：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;非同期関数だからテスト容易&lt;/li&gt;
&lt;li&gt;環境変数は&lt;code&gt;context.environment&lt;/code&gt;経由で型安全に取得&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;Response&lt;/code&gt;返却でパイプラインをショートサーキットし、認証エラー等を即時表現&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  2026年版 Zuploの料金
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;無料（$0/月）&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
月10万リクエスト・無制限環境/キー/ポータル・1GB egress・300エッジデプロイ・開発者2名まで。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;ビルダー（$25/月）&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
月100万リクエスト・2カスタムドメイン・追加リクエストは10万件毎に$100・コミュニティサポート。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;エンタープライズ（$1,000/月～年契約）&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
無制限リクエスト/ドメイン・SLA（99.5-99.999%）・GitHub Enterprise/GitLab統合・RBAC/SSO・監視・24/365サポートなど。&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;AI GatewayやOSS自己ホストポータルは別枠。最新は&lt;a href="https://zuplo.com/pricing" rel="noopener noreferrer"&gt;公式料金&lt;/a&gt;を要確認。&lt;/p&gt;

&lt;p&gt;参考: AWS API Gatewayは100万RESTリクエストで$3.50+データ転送+Lambda費用。KongのエンタープライズはZuploより高額傾向。無料枠だけでも十分な価値。&lt;/p&gt;

&lt;h2&gt;
  
  
  Zuploの適用シーン／非適用シーン
&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;適している場合：&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;マネージドゲートウェイ希望、Kubernetes運用したくない&lt;/li&gt;
&lt;li&gt;TypeScript/JavaScriptに強み&lt;/li&gt;
&lt;li&gt;開発者ポータルを別ベンダーなしで用意したい&lt;/li&gt;
&lt;li&gt;API収益化・Stripe組み込み希望&lt;/li&gt;
&lt;li&gt;AIエージェント向けMCPサポートを手軽にしたい&lt;/li&gt;
&lt;li&gt;グローバルトラフィック・エッジレイテンシ重視&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;向かない場合：&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;ゲートウェイの完全OSS制御が必須（Kong推奨）&lt;/li&gt;
&lt;li&gt;完全オンプレ・Egress不可（Kong/Tyk自己ホスト型推奨）&lt;/li&gt;
&lt;li&gt;NGINX等、特殊な内部アクセス要件&lt;/li&gt;
&lt;li&gt;Apigee/MuleSoft等に既に深く投資済み&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  ApidogでZuploゲートウェイをテストする
&lt;/h2&gt;

&lt;p&gt;プレビュー環境稼働後、本番昇格前に全ルート・全ポリシー・全エッジケースの自動テストを実施しましょう。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;ならOpenAPI仕様をそのままインポート→Zuploルートと同じ仕様でテストが構築可能。&lt;/p&gt;

&lt;p&gt;活用例：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;有効/無効APIキーで呼び出し、認証ポリシー検証&lt;/li&gt;
&lt;li&gt;不正ペイロード送信でリクエスト検証の動作確認&lt;/li&gt;
&lt;li&gt;高頻度リクエストでレート制限の閾値テスト&lt;/li&gt;
&lt;li&gt;プレビュー/本番URLやAPIキーを環境変数でワンクリック切替&lt;/li&gt;
&lt;li&gt;cURL/JavaScript/Python/Goのコードサンプル生成&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;自動テストシナリオも実行可能。スクリプト不要で高速。&lt;a href="http://apidog.com/blog/how-to-use-apidog-inside-vscode?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;VS Code拡張&lt;/a&gt;や&lt;a href="http://apidog.com/blog/api-testing-without-postman-2026?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;PostmanレスAPIテストガイド&lt;/a&gt;も参考に。&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidogダウンロードはこちら&lt;/a&gt;。&lt;/p&gt;

&lt;h2&gt;
  
  
  Zuplo APIゲートウェイに関するよくある質問
&lt;/h2&gt;

&lt;h3&gt;
  
  
  Zuploはオープンソース？
&lt;/h3&gt;

&lt;p&gt;コアゲートウェイはクローズドソースですが、開発者ポータルや一部ライブラリはGitHubでOSS化。自己ホスト型Kubernetes＋OSSポータルで多くの要件をカバー可能。多くのチームはマネージドサービスを選択。&lt;/p&gt;

&lt;h3&gt;
  
  
  Zuploは自社インフラで動かせる？
&lt;/h3&gt;

&lt;p&gt;エンタープライズプランで自己ホスト型Kubernetesデプロイ可。エッジ分散は不可、自身で運用管理。データレジデンシー重視の組織に最適。&lt;/p&gt;

&lt;h3&gt;
  
  
  ZuploとCloudflare API Shieldの違い？
&lt;/h3&gt;

&lt;p&gt;API Shieldはスキーマ検証・mTLS等のセキュリティ特化。Zuploはルーティング・ポリシー・開発者ポータル・収益化・MCP等、API管理のフルプラットフォーム。セキュリティのみならAPI Shield、本格管理ならZuplo。&lt;/p&gt;

&lt;h3&gt;
  
  
  既存のOpenAPI仕様で使える？
&lt;/h3&gt;

&lt;p&gt;はい。ZuploはOpenAPI仕様が唯一の信頼ソース。インポートでルート・ポータル・検証ポリシー全て生成。既存仕様が乱雑な場合もインポート時に問題を把握可能。&lt;/p&gt;

&lt;h3&gt;
  
  
  ClaudeやCodexなどAIエージェントから公開できる？
&lt;/h3&gt;

&lt;p&gt;MCPサーバーハンドラー経由で可能。OpenAPI仕様と公開操作を指定するだけでMCP互換クライアントから呼び出し可。認証・レート制限も自動適用。&lt;/p&gt;

&lt;h3&gt;
  
  
  デプロイにかかる時間は？
&lt;/h3&gt;

&lt;p&gt;プレビュー環境はPush-to-Deployで60秒未満。本番昇格はさらに高速。メンテナンスウィンドウ不要、アトミックに切替。&lt;/p&gt;

&lt;h3&gt;
  
  
  Cloudflareが障害を起こした場合は？
&lt;/h3&gt;

&lt;p&gt;ZuploはCloudflareエッジ上で稼働。地域障害時は影響あり。エンタープライズではマルチクラウドフェイルオーバー（99.999% SLA）も提供。大半のチームはCloudflareの高信頼性を受容。&lt;/p&gt;

&lt;h2&gt;
  
  
  結論
&lt;/h2&gt;

&lt;p&gt;Zuploは、TypeScriptネイティブなポリシー、GitOpsデプロイ、自動開発者ポータル、組み込み収益化、AIエージェント対応MCPサポートで、単なるルーティングレイヤーを超えたAPI管理プラットフォームです。無料枠も実プロダクション対応、エンタープライズ要件も十分カバー。&lt;/p&gt;

&lt;p&gt;評価時は、1つのAPIで30分セットアップ＆&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;で全ポリシーを実際にテストし、マーケティングではなく実証ベースで判断を。マネージドエッジゲートウェイ＋強力なテストクライアントの組み合わせは、「APIがある」から「製品がある」へ最速の道です。&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidogダウンロードはこちら&lt;/a&gt;。&lt;/p&gt;

</description>
    </item>
    <item>
      <title>DeepSeek V4を無料で使う方法</title>
      <dc:creator>Akira</dc:creator>
      <pubDate>Fri, 24 Apr 2026 04:27:27 +0000</pubDate>
      <link>https://dev.to/aakira/deepseek-v4wowu-liao-deshi-ufang-fa-3glh</link>
      <guid>https://dev.to/aakira/deepseek-v4wowu-liao-deshi-ufang-fa-3glh</guid>
      <description>&lt;p&gt;DeepSeek V4は2026年4月23日にリリースされ、他の最先端モデルとは異なり無料で利用できます。公式チャット（V4-Pro）はクレジットカード不要で即利用可能。モデルのウェイトはMITライセンスで公開されており、すぐにダウンロードできます。OpenRouterやChutesなどのアグリゲーターも数日以内に無料枠を開放するため、アカウントにチャージする前に本格的なV4のワークロードを無料で実行できます。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;今すぐApidogを試す&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;このガイドでは、すべての無料パスとその適用ユースケース、さらに利用増加時にスムーズに有料へ移行できるよう&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;で本番対応コレクションを構築する実践的な方法を示します。&lt;/p&gt;

&lt;p&gt;製品概要は&lt;a href="http://apidog.com/blog/what-is-deepseek-v4" rel="noopener noreferrer"&gt;DeepSeek V4とは&lt;/a&gt;、APIの詳細は&lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-api" rel="noopener noreferrer"&gt;DeepSeek V4 APIの使用方法&lt;/a&gt;を参照してください。&lt;/p&gt;

&lt;h2&gt;
  
  
  要するに
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;&lt;a href="http://chat.deepseek.com" rel="noopener noreferrer"&gt;chat.deepseek.com&lt;/a&gt;&lt;/strong&gt; — V4-Proの無料ウェブチャット。Think High/Max切り替え可能。カード不要で即時利用。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Hugging Faceのウェイト + 自身のGPU&lt;/strong&gt; — MITライセンス。V4-Flashは2～4台のH100で稼働、V4-Proはクラスターが必要。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;OpenRouterやChutesの無料枠&lt;/strong&gt; — DeepSeekリリース直後に無料クォータを開放するサードパーティゲートウェイ。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Hugging Face推論プロバイダー&lt;/strong&gt; — 初期実験向けに公開された共有・レート制限エンドポイント。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Kaggle、Colab、RunPodのトライアルクレジット&lt;/strong&gt; — セルフホスティング一度きりの実験用の無料計算リソース。&lt;/li&gt;
&lt;li&gt;すべての無料パスには上限あり。本番運用は上限到達前に有料へ移行してください。&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F1pwj8dblm7dbxk7xooey.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F1pwj8dblm7dbxk7xooey.png" alt="画像" width="800" height="550"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  パス1：chat.deepseek.com（デフォルトの無料パス）
&lt;/h2&gt;

&lt;p&gt;最速かつ信頼性が高い無料パスは公式チャットインターフェースです。V4-Proがデフォルトで、非思考・思考高・思考最大の3モードをコンポーザー上部で切り替え可能。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fod1zc2ye1qsto7o0xxbc.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fod1zc2ye1qsto7o0xxbc.png" alt="画像" width="800" height="434"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h3&gt;
  
  
  セットアップ
&lt;/h3&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;a href="https://chat.deepseek.com/" rel="noopener noreferrer"&gt;chat.deepseek.com&lt;/a&gt;を開く&lt;/li&gt;
&lt;li&gt;メール、Google、WeChatでサインイン&lt;/li&gt;
&lt;li&gt;アクティブモデルがV4-Proであることを確認&lt;/li&gt;
&lt;li&gt;入力開始&lt;/li&gt;
&lt;/ol&gt;

&lt;h3&gt;
  
  
  得られるもの
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;1Mトークンのコンテキストウィンドウ&lt;/li&gt;
&lt;li&gt;PDF/画像/コードバンドルのファイルアップロード&lt;/li&gt;
&lt;li&gt;オンデマンドWeb検索&lt;/li&gt;
&lt;li&gt;3つの推論モード（Think Max含む）&lt;/li&gt;
&lt;li&gt;会話履歴とフォルダ管理&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  上限について
&lt;/h3&gt;

&lt;p&gt;1日あたりのメッセージ数は非公開。負荷が高まるとソフトに制限され、応答遅延やキューイングが発生しますが、ハードブロックは稀。継続的なレート制限はAPI移行を検討するサインです。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;適したタスク&lt;/strong&gt;: 高難度プロンプトの比較、リポジトリのtarball貼付けでのアーキテクチャレビュー、大規模な契約書のThink Max実行など&lt;br&gt;&lt;br&gt;
&lt;strong&gt;不向きなタスク&lt;/strong&gt;: 自動化や再現性が必要な作業&lt;/p&gt;
&lt;h2&gt;
  
  
  パス2：自身のGPUでV4-Flashをセルフホスト
&lt;/h2&gt;

&lt;p&gt;V4-FlashはMITライセンスで提供され、実質的に誰でもセルフホスト可能です。FP8で約500GB、INT4量子化で80GBカード1枚に収まります。&lt;/p&gt;

&lt;p&gt;コストはライセンスではなくハードウェア。既存GPUがあれば最も持続可能な無料パスです。&lt;/p&gt;
&lt;h3&gt;
  
  
  ウェイトをプルする
&lt;/h3&gt;


&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;pip &lt;span class="nb"&gt;install&lt;/span&gt; &lt;span class="nt"&gt;-U&lt;/span&gt; &lt;span class="s2"&gt;"huggingface_hub[cli]"&lt;/span&gt;
huggingface-cli login
huggingface-cli download deepseek-ai/DeepSeek-V4-Flash &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--local-dir&lt;/span&gt; ./models/deepseek-v4-flash
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;


&lt;p&gt;FP8：約500GB。ディスク容量に注意。&lt;/p&gt;
&lt;h3&gt;
  
  
  vLLMでサービング
&lt;/h3&gt;


&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;pip &lt;span class="nb"&gt;install&lt;/span&gt; &lt;span class="s2"&gt;"vllm&amp;gt;=0.9.0"&lt;/span&gt;

vllm serve deepseek-ai/DeepSeek-V4-Flash &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--tensor-parallel-size&lt;/span&gt; 4 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--max-model-len&lt;/span&gt; 1048576 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--dtype&lt;/span&gt; auto &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--port&lt;/span&gt; 8000
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;


&lt;p&gt;起動後、OpenAI互換クライアントを &lt;code&gt;http://localhost:8000/v1&lt;/code&gt; に向けて利用可能。有料DeepSeek APIと同じリクエスト形式を受け付けます。&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;でベースURLを切り替えるだけで既存コレクションをそのまま使えます。&lt;/p&gt;
&lt;h3&gt;
  
  
  ハードウェアの現実的な確認
&lt;/h3&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;バリアント&lt;/th&gt;
&lt;th&gt;最小カード数 (FP8)&lt;/th&gt;
&lt;th&gt;最小カード数 (INT4)&lt;/th&gt;
&lt;th&gt;現実的なスループット&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;V4-Flash&lt;/td&gt;
&lt;td&gt;H100 80GB × 2&lt;/td&gt;
&lt;td&gt;H100 80GB × 1&lt;/td&gt;
&lt;td&gt;50～150トークン/秒&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;V4-Pro&lt;/td&gt;
&lt;td&gt;H100 80GB × 16&lt;/td&gt;
&lt;td&gt;H100 80GB × 8&lt;/td&gt;
&lt;td&gt;クラスターに依存&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;遊休カードがない場合はAPI利用の方が費用対効果が高いです。セルフホストは既存リソースがある、または厳格なコンプライアンス要件がある場合に有効。&lt;/p&gt;
&lt;h2&gt;
  
  
  パス3：OpenRouterの無料枠
&lt;/h2&gt;

&lt;p&gt;OpenRouterは、オープン／クローズドモデルを単一API経由で利用できるアグリゲーター。DeepSeek新リリース時には無料枠を定期的に提供します（V3系も同様）。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fbir19t7193o5qk1c978b.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fbir19t7193o5qk1c978b.png" alt="画像" width="800" height="293"&gt;&lt;/a&gt;&lt;/p&gt;
&lt;h3&gt;
  
  
  セットアップ
&lt;/h3&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;a href="https://openrouter.ai/" rel="noopener noreferrer"&gt;openrouter.ai&lt;/a&gt;にサインアップ&lt;/li&gt;
&lt;li&gt;APIキー発行&lt;/li&gt;
&lt;li&gt;モデルカタログで &lt;code&gt;deepseek/deepseek-v4-pro&lt;/code&gt; または &lt;code&gt;deepseek/deepseek-v4-flash&lt;/code&gt; を確認（無料バリアントには&lt;code&gt;:free&lt;/code&gt;サフィックス）&lt;/li&gt;
&lt;li&gt;OpenAI互換SDKで利用
&lt;/li&gt;
&lt;/ol&gt;
&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight python"&gt;&lt;code&gt;&lt;span class="kn"&gt;from&lt;/span&gt; &lt;span class="n"&gt;openai&lt;/span&gt; &lt;span class="kn"&gt;import&lt;/span&gt; &lt;span class="n"&gt;OpenAI&lt;/span&gt;

&lt;span class="n"&gt;client&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="nc"&gt;OpenAI&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="n"&gt;api_key&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="n"&gt;OPENROUTER_KEY&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;base_url&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;https://openrouter.ai/api/v1&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="n"&gt;response&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;client&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;chat&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;completions&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;create&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="n"&gt;model&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;deepseek/deepseek-v4-flash:free&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;messages&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;[{&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;role&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;user&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;content&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;Write a Python CLI for semver bumping.&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;}],&lt;/span&gt;
&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="nf"&gt;print&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;response&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;choices&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="mi"&gt;0&lt;/span&gt;&lt;span class="p"&gt;].&lt;/span&gt;&lt;span class="n"&gt;message&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;content&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;

&lt;h3&gt;
  
  
  上限
&lt;/h3&gt;

&lt;p&gt;通常、キーごとに1日数百リクエスト。負荷増大時は優先度低下。プロトタイピング向きで本番利用には不向き。&lt;/p&gt;
&lt;h2&gt;
  
  
  パス4：Hugging Face推論プロバイダー
&lt;/h2&gt;

&lt;p&gt;Hugging FaceはV4チェックポイントを即日推論サービスとして公開。レート制限やレイテンシーはありますが、無料でAPI利用可能。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight python"&gt;&lt;code&gt;&lt;span class="kn"&gt;from&lt;/span&gt; &lt;span class="n"&gt;huggingface_hub&lt;/span&gt; &lt;span class="kn"&gt;import&lt;/span&gt; &lt;span class="n"&gt;InferenceClient&lt;/span&gt;

&lt;span class="n"&gt;client&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="nc"&gt;InferenceClient&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;model&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;deepseek-ai/DeepSeek-V4-Flash&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="n"&gt;response&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;client&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;chat_completion&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="n"&gt;messages&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;[{&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;role&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;user&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;content&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;Summarize the V4 technical report in 5 bullets.&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;}],&lt;/span&gt;
    &lt;span class="n"&gt;max_tokens&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="mi"&gt;512&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="nf"&gt;print&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;response&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;choices&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="mi"&gt;0&lt;/span&gt;&lt;span class="p"&gt;].&lt;/span&gt;&lt;span class="n"&gt;message&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;content&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;HFトークンは無料。頻度が高い場合はProへアップグレード。公式APIに比べてコストは圧倒的に低い。&lt;/p&gt;

&lt;h2&gt;
  
  
  パス5：Colab、Kaggle、RunPod、Lambdaのトライアルクレジット
&lt;/h2&gt;

&lt;p&gt;主要GPUレンタルプロバイダーのトライアルを活用し、費用ゼロでV4-Flashの実験が可能。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Google Colab&lt;/strong&gt;: 無料T4は容量不足。Colab Pro+はA100でV4-Flash実験に十分。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Kaggle&lt;/strong&gt;: T4/P100で毎週無料GPU時間。量子化V4-Flashの実験向き。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;RunPod&lt;/strong&gt;: $10トライアルでH100を数時間利用可能。vLLM起動＆ベンチマークも余裕。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Lambda&lt;/strong&gt;: H100/H200で期間限定無料プロモ有り。要サインアップページ確認。&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;いずれも長期利用は不可。限定的な一回実験向き。&lt;/p&gt;

&lt;h2&gt;
  
  
  プロバイダーに依存しないApidogコレクションの構築
&lt;/h2&gt;

&lt;p&gt;複数の無料パスを同一ワークフローでA/Bテストできるのが大きな利点です。&lt;/p&gt;

&lt;p&gt;手順:&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;Apidogをダウンロード&lt;/li&gt;
&lt;li&gt;4つの環境を持つコレクション作成:

&lt;ul&gt;
&lt;li&gt;
&lt;code&gt;chat&lt;/code&gt;（プレースホルダー）
&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;deepseek&lt;/code&gt;（&lt;code&gt;https://api.deepseek.com/v1&lt;/code&gt;）
&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;openrouter&lt;/code&gt;（&lt;code&gt;https://openrouter.ai/api/v1&lt;/code&gt;）
&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;self-hosted&lt;/code&gt;（&lt;code&gt;http://localhost:8000/v1&lt;/code&gt;）&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;{{BASE_URL}}/chat/completions&lt;/code&gt;へのPOSTリクエストを保存&lt;/li&gt;
&lt;li&gt;各プロバイダーのキーをシークレット変数で管理し、リクエストボディを共通化&lt;/li&gt;
&lt;li&gt;環境を切り替えて各バックエンドで同一プロンプトをA/Bテスト&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;これは&lt;a href="http://apidog.com/blog/how-to-use-gpt-5-5-api-for-free" rel="noopener noreferrer"&gt;GPT-5.5無料枠コレクション&lt;/a&gt;と同様のパターンです。1ツールで全プロバイダーに対応、作業の重複なし。&lt;/p&gt;

&lt;h2&gt;
  
  
  どの無料パスを選ぶべきか？
&lt;/h2&gt;

&lt;p&gt;判断基準は以下の通り:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;5分で意見を形成したい&lt;/strong&gt; → &lt;a href="http://chat.deepseek.com" rel="noopener noreferrer"&gt;chat.deepseek.com&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;プロダクトのプロトタイプを作りたい&lt;/strong&gt; → OpenRouter無料枠を使い切ったらDeepSeekにチャージ&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;GPU/コンプライアンス要件あり&lt;/strong&gt; → vLLM＋V4-Flashセルフホスト&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;長期無料利用したい&lt;/strong&gt; → できません。どこかで必ず上限有り。対話作業は&lt;a href="http://chat.deepseek.com" rel="noopener noreferrer"&gt;chat.deepseek.com&lt;/a&gt;、自動化は有料チャージ併用を。&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  無料利用から移行すべきタイミング
&lt;/h2&gt;

&lt;p&gt;次のいずれかに該当したら有料APIへ移行を検討してください。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;1日に複数回レート制限に達する&lt;/strong&gt; → ワークロードが予算化に値する規模&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;SLAが必要&lt;/strong&gt; → 無料枠では保証なし。公式APIのみ対応&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;ログ・監査・コンプライアンスが必要&lt;/strong&gt; → 有料APIは請求記録あり、無料枠は不可&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;該当時は&lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-api" rel="noopener noreferrer"&gt;公式API&lt;/a&gt;に移行を。最低チャージ2ドル、トークン単価は最先端層で最安。&lt;/p&gt;

&lt;h2&gt;
  
  
  よくある質問
&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;&lt;a href="http://chat.deepseek.com" rel="noopener noreferrer"&gt;chat.deepseek.com&lt;/a&gt;は本当に無料？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
はい。クレジットカード・トライアル期間不要。ソフト制限はありますが有料化されていません。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;ウェイトをダウンロードするのにHugging Faceアカウントは必要？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
不要ですが、ログイン済みアカウントの方がレート制限が緩和されます。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;どの無料パスでV4-Proが実行される？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
&lt;a href="http://chat.deepseek.com" rel="noopener noreferrer"&gt;chat.deepseek.com&lt;/a&gt;は完全なV4-Pro。OpenRouter無料枠はV4-Flashが多い。V4-Pro出力が必要で無料にこだわるならウェブチャット一択。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;製品バックエンドに無料枠を使える？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
不可。無料枠はレート制限・規約変更・消滅リスク有り。顧客提供は有料APIまたはセルフホスト必須。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;セルフホストは本当に無料？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
ライセンスは無料だがハードウェアは別。既存GPUなら限界費用は電気代のみ。レンタルGPUなら有料APIの方が安価な場合も。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Apidogのテスト用無料枠はある？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;はAPI設計・テスト用途で無料利用可。有料API利用時のみクレジット消費。無料Apidogワークスペース＋&lt;a href="http://chat.deepseek.com" rel="noopener noreferrer"&gt;chat.deepseek.com&lt;/a&gt;またはOpenRouterの組み合わせで完全無料ワークフローも可能です。&lt;/p&gt;

</description>
    </item>
    <item>
      <title>DeepSeek V4 ローカル実行方法</title>
      <dc:creator>Akira</dc:creator>
      <pubDate>Fri, 24 Apr 2026 04:23:10 +0000</pubDate>
      <link>https://dev.to/aakira/deepseek-v4-rokarushi-xing-fang-fa-14cg</link>
      <guid>https://dev.to/aakira/deepseek-v4-rokarushi-xing-fang-fa-14cg</guid>
      <description>&lt;p&gt;DeepSeek V4が2026年4月23日にリリースされ、Hugging FaceでMITライセンスのウェイトが公開されました。MITライセンスの登場により、自社ハードウェアでAIを運用したい開発チームにとって、選択肢が大きく広がります。V4-Flash（計284Bパラメータ、アクティブ13B）はH100 2枚でFP8動作、V4-Pro（計1.6T、アクティブ49B）はクラスタ構成が必要ですが、GPT-5.5/Claude Opus 4.6と並ぶ性能を持ちます。&lt;br&gt;&lt;br&gt;
このガイドでは、ローカル自己ホストのセットアップ手順、必要なハードウェア構成、量子化（低メモリ化）、サービングエンジン（vLLM/SGLang）の導入方法、ツール連携、そしてApidogによるローカルサーバーのテストワークフローを具体的に解説します。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;今すぐApidogを試す&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;製品概要は、&lt;a href="http://apidog.com/blog/what-is-deepseek-v4?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeek V4とは&lt;/a&gt;をご覧ください。ホスト型APIの使い方は、&lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeek V4 APIの利用方法&lt;/a&gt;を参照ください。コスト比較は、&lt;a href="http://apidog.com/blog/deepseek-v4-api-pricing?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeek V4 APIの料金&lt;/a&gt;を確認してください。&lt;/p&gt;

&lt;h2&gt;
  
  
  要点（TL;DR）
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;V4-Flash&lt;/strong&gt;: FP8ではH100 80GB×2枚、INT4ではH100×1枚で動作。FP8時のウェイトは約500GB。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;V4-Pro&lt;/strong&gt;: 本番運用にはFP8でH100 16台以上が必要。ラップトップ向けではありません。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;vLLM&lt;/strong&gt;: OpenAI互換サーバーを最速で構築可能。&lt;code&gt;vllm&amp;gt;=0.9.0&lt;/code&gt;でV4対応済み。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;SGLang&lt;/strong&gt;: ツール利用・構造化出力重視のチーム向け。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;量子化（AWQ/GPTQ INT4）&lt;/strong&gt;: V4-Flashが80GBカード1枚で動作、品質低下は約5%以内。&lt;/li&gt;
&lt;li&gt;
&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;で&lt;code&gt;http://localhost:8000/v1&lt;/code&gt;に接続、ホスト型APIのコレクションをローカルでも再利用可能。&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  自己ホストを検討すべきチーム
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;コンプライアンス要件&lt;/strong&gt;: 医療・金融・法務・防衛等、ネットワーク外にデータを出せない場合。MITライセンスで利用規約・越境制限なし。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;大規模・安定ワークロード&lt;/strong&gt;: 月間2,000億トークン超でAPI利用料より専用ハードが経済的。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;ファインチューニング・研究&lt;/strong&gt;: 継続事前学習や独自適応用途。MITライセンスで商用再配布も可能。&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;自己ホストが不要なケース&lt;/strong&gt;: プロトタイピング、小規模（月200ドル以内）、GPU運用経験なし。こうした場合は運用コストが割高になります。&lt;/p&gt;

&lt;h2&gt;
  
  
  ハードウェア要件
&lt;/h2&gt;

&lt;p&gt;DeepSeek V4はFP4+FP8混合精度。単純なパラメータ数よりもメモリ消費は抑制されています。&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;バリアント&lt;/th&gt;
&lt;th&gt;総パラメータ数&lt;/th&gt;
&lt;th&gt;アクティブパラメータ&lt;/th&gt;
&lt;th&gt;FP8 VRAM&lt;/th&gt;
&lt;th&gt;INT4 VRAM&lt;/th&gt;
&lt;th&gt;最小カード構成&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;V4-Flash&lt;/td&gt;
&lt;td&gt;284B&lt;/td&gt;
&lt;td&gt;13B&lt;/td&gt;
&lt;td&gt;~500GB&lt;/td&gt;
&lt;td&gt;~140GB&lt;/td&gt;
&lt;td&gt;H100 80GB×2（FP8）/ H100×1（INT4)&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;V4-Pro&lt;/td&gt;
&lt;td&gt;1.6T&lt;/td&gt;
&lt;td&gt;49B&lt;/td&gt;
&lt;td&gt;~2.4TB&lt;/td&gt;
&lt;td&gt;~700GB&lt;/td&gt;
&lt;td&gt;H100 80GB×16（FP8）/ H100×8（INT4)&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;&lt;strong&gt;補足:&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;MoEの「アクティブ」は計算コストのみ。全エキスパート分のVRAMが必要。&lt;/li&gt;
&lt;li&gt;H200/MI300XはVRAM容量によってカード枚数を削減可能。&lt;/li&gt;
&lt;li&gt;RTX/GeForce等のコンシューマGPUは非推奨（要件を満たさない）。&lt;/li&gt;
&lt;li&gt;Apple Siliconは開発・検証用途のみ、運用には不向き。&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  ステップ1：ウェイトをダウンロードする
&lt;/h2&gt;

&lt;p&gt;公式リポジトリ：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;a href="https://huggingface.co/deepseek-ai/DeepSeek-V4-Flash" rel="noopener noreferrer"&gt;&lt;code&gt;deepseek-ai/DeepSeek-V4-Flash&lt;/code&gt;&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro" rel="noopener noreferrer"&gt;&lt;code&gt;deepseek-ai/DeepSeek-V4-Pro&lt;/code&gt;&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;ファインチューニング用：&lt;code&gt;deepseek-ai/DeepSeek-V4-Flash-Base&lt;/code&gt;、&lt;code&gt;DeepSeek-V4-Pro-Base&lt;/code&gt;
&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;CLIでダウンロード：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;pip &lt;span class="nb"&gt;install&lt;/span&gt; &lt;span class="nt"&gt;-U&lt;/span&gt; &lt;span class="s2"&gt;"huggingface_hub[cli]"&lt;/span&gt;
huggingface-cli login

huggingface-cli download deepseek-ai/DeepSeek-V4-Flash &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--local-dir&lt;/span&gt; ./models/deepseek-v4-flash &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--local-dir-use-symlinks&lt;/span&gt; False
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;ul&gt;
&lt;li&gt;V4-Flash：約500GB、V4-Pro：数TBの空き容量が必要です。&lt;/li&gt;
&lt;li&gt;ModelScope（&lt;a href="https://modelscope.cn/models/deepseek-ai/DeepSeek-V4-Flash" rel="noopener noreferrer"&gt;modelscope.cn&lt;/a&gt;）は中国ユーザー向けミラー。&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  ステップ2：サービングエンジンを選択する
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;vLLM&lt;/strong&gt;…最高のスループット、OpenAI互換API、最大コミュニティ。ほとんどの用途で推奨。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;SGLang&lt;/strong&gt;…ツール利用・構造化出力・長文コンテキスト用途。関数呼び出し依存ワークロード向け。&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;どちらも最新バージョンでV4対応済み。&lt;/p&gt;

&lt;h2&gt;
  
  
  ステップ3：vLLMでV4-Flashをサーブする
&lt;/h2&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;pip &lt;span class="nb"&gt;install&lt;/span&gt; &lt;span class="s2"&gt;"vllm&amp;gt;=0.9.0"&lt;/span&gt;

vllm serve deepseek-ai/DeepSeek-V4-Flash &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--tensor-parallel-size&lt;/span&gt; 2 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--max-model-len&lt;/span&gt; 1048576 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--dtype&lt;/span&gt; auto &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--enable-prefix-caching&lt;/span&gt; &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--port&lt;/span&gt; 8000
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;ul&gt;
&lt;li&gt;
&lt;code&gt;--tensor-parallel-size 2&lt;/code&gt;: H100 2枚で分割。カード枚数に応じて調整。&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;--max-model-len 1048576&lt;/code&gt;: 1Mトークンコンテキスト。不要なら短縮してVRAM節約。&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;--enable-prefix-caching&lt;/code&gt;: プレフィックスキャッシュ有効化。&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;--dtype auto&lt;/code&gt;: FP8混合精度を自動設定。&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;OpenAI互換クライアントで&lt;code&gt;http://localhost:8000/v1&lt;/code&gt;へアクセス可能。&lt;/p&gt;

&lt;h2&gt;
  
  
  ステップ4：vLLMでV4-Proをサーブする
&lt;/h2&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;vllm serve deepseek-ai/DeepSeek-V4-Pro &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--tensor-parallel-size&lt;/span&gt; 8 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--pipeline-parallel-size&lt;/span&gt; 2 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--max-model-len&lt;/span&gt; 524288 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--enable-prefix-caching&lt;/span&gt; &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--port&lt;/span&gt; 8000
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;ul&gt;
&lt;li&gt;例：H100 16枚構成。&lt;code&gt;max-model-len&lt;/code&gt;はVRAMに応じて調整。&lt;/li&gt;
&lt;li&gt;テンソル並列・パイプライン並列の組み合わせでクラスタ運用。&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  ステップ5：SGLangでサーブする（ツール利用強化）
&lt;/h2&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;pip &lt;span class="nb"&gt;install&lt;/span&gt; &lt;span class="s2"&gt;"sglang[all]&amp;gt;=0.4.0"&lt;/span&gt;

python &lt;span class="nt"&gt;-m&lt;/span&gt; sglang.launch_server &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--model-path&lt;/span&gt; deepseek-ai/DeepSeek-V4-Flash &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--tp&lt;/span&gt; 2 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--context-length&lt;/span&gt; 1048576 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--port&lt;/span&gt; 30000
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;ul&gt;
&lt;li&gt;
&lt;code&gt;http://localhost:30000/v1&lt;/code&gt;でOpenAI互換API公開。&lt;/li&gt;
&lt;li&gt;SGLangの&lt;code&gt;lang&lt;/code&gt; DSLは関数呼び出しやJSON出力で優位。&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  ステップ6：シングルGPU向けに量子化する
&lt;/h2&gt;

&lt;p&gt;INT4量子化でV4-FlashをH100 80GB×1枚で運用可能。品質低下は5%以内。&lt;/p&gt;

&lt;h3&gt;
  
  
  AWQ（推奨）
&lt;/h3&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;pip &lt;span class="nb"&gt;install &lt;/span&gt;autoawq

python &lt;span class="nt"&gt;-c&lt;/span&gt; &lt;span class="s2"&gt;"
from awq import AutoAWQForCausalLM
from transformers import AutoTokenizer

model_path = './models/deepseek-v4-flash'
out_path = './models/deepseek-v4-flash-awq'
model = AutoAWQForCausalLM.from_pretrained(model_path)
tokenizer = AutoTokenizer.from_pretrained(model_path)
model.quantize(tokenizer, quant_config={'w_bit': 4, 'q_group_size': 128})
model.save_quantized(out_path)
tokenizer.save_pretrained(out_path)
"&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h3&gt;
  
  
  GPTQ
&lt;/h3&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;pip &lt;span class="nb"&gt;install &lt;/span&gt;auto-gptq
&lt;span class="c"&gt;# GPTQ量子化のレシピを参照。AWQ同様の手順。&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;ul&gt;
&lt;li&gt;量子化済みチェックポイントはvLLM起動時に&lt;code&gt;--quantization awq&lt;/code&gt;/&lt;code&gt;gptq&lt;/code&gt;指定。&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  ステップ7：Apidogでテストする
&lt;/h2&gt;

&lt;p&gt;本番トラフィック投入前にローカルサーバーを検証しましょう。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-228.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-228.png" alt="Apidogの画面例" width="800" height="530"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;をインストール。&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;http://localhost:8000/v1/chat/completions&lt;/code&gt; を指すAPIコレクションを作成。&lt;/li&gt;
&lt;li&gt;ホスト型APIで使っているテストプロンプトを貼り付け、応答を比較。&lt;/li&gt;
&lt;li&gt;50万トークンのコンテキスト投入でKVキャッシュ挙動を確認。&lt;/li&gt;
&lt;li&gt;エージェントループ接続前にツール呼び出しフローをE2E検証。&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;ホスト型API用コレクションは、Base URLの切り替えのみでローカルにも流用できます。&lt;/p&gt;

&lt;h2&gt;
  
  
  可観測性と監視
&lt;/h2&gt;

&lt;p&gt;運用開始時点から最低限以下の4メトリクスを追跡：&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;1秒あたりトークン数&lt;/strong&gt;（プロンプト・生成両方）。vLLMはPrometheus形式で&lt;code&gt;/metrics&lt;/code&gt;に出力。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;GPU利用率&lt;/strong&gt;（&lt;code&gt;nvidia-smi&lt;/code&gt;/DCGM）。70%未満はバッチサイズの最適化不足。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;KVキャッシュヒット率&lt;/strong&gt;（&lt;code&gt;--enable-prefix-caching&lt;/code&gt;利用時に取得可）。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;リクエストレイテンシ（p50/p95/p99）&lt;/strong&gt;。p99が高い場合は一部リクエスト形状がボトルネック。&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;これらはGrafana等の監視基盤へ連携推奨。&lt;/p&gt;

&lt;h2&gt;
  
  
  V4ベースチェックポイントのファインチューニング
&lt;/h2&gt;

&lt;p&gt;ベースモデルは継続事前学習やSFT用途。LoRAアダプタによるSFT例：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;pip &lt;span class="nb"&gt;install&lt;/span&gt; &lt;span class="s2"&gt;"torch&amp;gt;=2.6"&lt;/span&gt; transformers accelerate peft trl

python &lt;span class="nt"&gt;-m&lt;/span&gt; trl sft &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--model_name_or_path&lt;/span&gt; deepseek-ai/DeepSeek-V4-Flash-Base &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--dataset_name&lt;/span&gt; your-org/your-sft-set &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--output_dir&lt;/span&gt; ./models/v4-flash-custom &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--per_device_train_batch_size&lt;/span&gt; 1 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--gradient_accumulation_steps&lt;/span&gt; 16 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--learning_rate&lt;/span&gt; 2e-5 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--bf16&lt;/span&gt; &lt;span class="nb"&gt;true&lt;/span&gt; &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--use_peft&lt;/span&gt; &lt;span class="nb"&gt;true&lt;/span&gt; &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--lora_r&lt;/span&gt; 64 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--lora_alpha&lt;/span&gt; 128
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;V4-Proのフルファインチューニングは研究用途。大半のチームはV4-Flash-Base＋LoRAで十分実用的です。&lt;/p&gt;

&lt;h2&gt;
  
  
  よくある落とし穴
&lt;/h2&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;OOM（メモリ不足）&lt;/strong&gt;: &lt;code&gt;--max-model-len&lt;/code&gt;がVRAMに対して過大、または並列値が低すぎる。コンテキスト短縮or並列度UPで対応。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;初回リクエストが遅い&lt;/strong&gt;: vLLMはカーネル遅延コンパイル。ウォームアップリクエストで解消。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;ツール利用時のパースエラー&lt;/strong&gt;: DeepSeekのエンコーディングはOpenAIと異なる場合あり。SDKバージョン固定推奨。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;古いGPUでFP8エラー&lt;/strong&gt;: A100はFP8非対応。BF16運用時はVRAM消費増加に注意。&lt;/li&gt;
&lt;/ol&gt;

&lt;h2&gt;
  
  
  自己ホストが採算が取れる時
&lt;/h2&gt;

&lt;p&gt;&lt;a href="http://apidog.com/blog/deepseek-v4-api-pricing?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;料金情報&lt;/a&gt;に基づく概算：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;V4-Flash：月間2000億入力+200億出力トークン&lt;/strong&gt;

&lt;ul&gt;
&lt;li&gt;ホスト型API：約33,600ドル&lt;/li&gt;
&lt;li&gt;H100×8レンタル：約20,000ドル→自己ホストが40%有利&lt;/li&gt;
&lt;/ul&gt;


&lt;/li&gt;

&lt;li&gt;

&lt;strong&gt;V4-Pro：月間5000億入力+500億出力トークン&lt;/strong&gt;

&lt;ul&gt;
&lt;li&gt;ホスト型API：約104万ドル&lt;/li&gt;
&lt;li&gt;H100×16クラスタ：約35,000ドル→自己ホストが95%以上有利&lt;/li&gt;
&lt;/ul&gt;


&lt;/li&gt;

&lt;/ul&gt;

&lt;p&gt;V4-Flashは月間1000億トークン超が損益分岐点。それ以下はAPI利用が推奨。&lt;/p&gt;

&lt;h2&gt;
  
  
  よくある質問
&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;Q: V4-FlashはA100で動く？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
A: 強い量子化＋短コンテキストで可能。ただし遅い（INT4で5～15トークン/秒）。本来はH100推奨。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Q: LoRAファインチューニング対応？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
A: 対応。ベースチェックポイント＋TRL/Axolotl等標準パイプラインでOK。MoEルーティングは影響なし。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Q: ローカルサーバーはOpenAI互換？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
A: vLLM/SGLangとも&lt;code&gt;/v1/chat/completions&lt;/code&gt;などOpenAI互換APIを提供。&lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;APIガイド&lt;/a&gt;もlocalhostで利用可能。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Q: ローカルで思考モード有効化は？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
A: リクエストボディに&lt;code&gt;thinking_mode: "thinking"&lt;/code&gt;または&lt;code&gt;"thinking_max"&lt;/code&gt;を指定。vLLM/SGLangで対応。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Q: ストリーミング出力対応？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
A: &lt;code&gt;stream: true&lt;/code&gt;を指定すればOpenAI/ホストAPI同様に対応。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Q: 機材購入前に安価に試す方法は？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
A: RunPodやLambdaでH100を時間単位レンタルし、INT4でV4-Flashをテスト。10～30ドル程度で現実的なスループットを実測可能。&lt;/p&gt;

</description>
    </item>
    <item>
      <title>DeepSeek V4 API 無料 使い方</title>
      <dc:creator>Akira</dc:creator>
      <pubDate>Fri, 24 Apr 2026 04:21:45 +0000</pubDate>
      <link>https://dev.to/aakira/deepseek-v4-api-wu-liao-shi-ifang-2hfd</link>
      <guid>https://dev.to/aakira/deepseek-v4-api-wu-liao-shi-ifang-2hfd</guid>
      <description>&lt;p&gt;DeepSeek V4は2026年4月23日にリリースされ、そのAPI価格は、ほとんどのチームが無料枠探しを完全にスキップするほど低く設定されています。しかし、クレジットカード情報を登録する前にプログラムでV4を呼び出したい開発者向けには、真の無料パスが存在します。アグリゲーターゲートウェイは&lt;code&gt;:free&lt;/code&gt;バリアントを公開しており、Hugging Faceは共有推論エンドポイントを提供し、公式APIは新規アカウントにトライアルクレジットを付与します。これら3つを組み合わせてApidogでフォールバックチェーンを構築すれば、一切費用をかけずにV4搭載製品のプロトタイプを作成できます。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;Apidogを今すぐ試す&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;このガイドはAPIに特化した無料パスです。ウェブチャットやセルフホスティングを含むより広範なガイドについては、&lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-for-free?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeek V4を無料で利用する方法&lt;/a&gt;をご覧ください。有料のウォークスルーについては、&lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeek V4 APIの利用方法&lt;/a&gt;をご覧ください。製品概要については、&lt;a href="http://apidog.com/blog/what-is-deepseek-v4?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeek V4とは何か&lt;/a&gt;をご覧ください。&lt;/p&gt;

&lt;h2&gt;
  
  
  TL;DR
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;OpenRouter無料枠&lt;/strong&gt; — &lt;code&gt;deepseek/deepseek-v4-flash:free&lt;/code&gt;、場合によっては&lt;code&gt;deepseek-v4-pro:free&lt;/code&gt;。OpenAI互換で、キーあたり1日数百リクエスト。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Hugging Face推論プロバイダー&lt;/strong&gt; — &lt;code&gt;https://router.huggingface.co/hf-inference&lt;/code&gt;で無料の共有エンドポイント。レート制限あり、プロトタイピングに便利。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Chutes無料枠&lt;/strong&gt; — リリースから1週間以内にDeepSeekの無料エンドポイントを頻繁に公開するコミュニティGPUネットワーク。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;DeepSeekトライアルクレジット&lt;/strong&gt; — &lt;code&gt;platform.deepseek.com&lt;/code&gt;の新規アカウントには、少額の初期残高が付与されることがあります。&lt;/li&gt;
&lt;li&gt;ご自身のGPUでセルフホストされたV4-Flashもライセンスレベルでは無料です。&lt;a href="http://apidog.com/blog/how-to-run-deepseek-v4-locally?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeek V4をローカルで実行する方法&lt;/a&gt;をご覧ください。&lt;/li&gt;
&lt;li&gt;プロバイダー間でリクエストの形式を同一に保つため、&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;でフォールバックチェーンを構築します。&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-227.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-227.png" alt="Apidogの画面スクリーンショット" width="800" height="550"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  なぜ無料APIパスが存在するのか
&lt;/h2&gt;

&lt;p&gt;DeepSeekの有料料金は、フロンティア層の中でも既に最も低い水準にあります。では、なぜ無料を探す必要があるのでしょうか？理由は3つあります。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;カード登録前のプロトタイピング。&lt;/strong&gt; 調達上の理由、または迅速な概念実証のために、支払い方法を登録する前にコードからV4を呼び出したい場合。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;学生、研究、オープンソースでの利用。&lt;/strong&gt; 予算を組めない小規模なプロジェクトでも、真のフロンティアレベルの品質を求めている場合。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;プロバイダーの比較。&lt;/strong&gt; 3つの異なる無料エンドポイントでV4に対して同じプロンプトを実行することで、本番トラフィックでしか現れないレイテンシー、品質、信頼性の違いが明らかになります。&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;これらのいずれかに当てはまるなら、このガイドはあなた向けです。出荷可能な製品を構築している場合は、&lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;有料APIガイド&lt;/a&gt;に進んでください。公式DeepSeek APIの最低2ドルのチャージは、レート制限と格闘するよりも良い選択肢です。&lt;/p&gt;

&lt;h2&gt;
  
  
  パス1: OpenRouter無料枠
&lt;/h2&gt;

&lt;p&gt;OpenRouterは、OpenAI互換APIの背後でフロンティアモデルを集約するリクエストレベルのゲートウェイです。このプラットフォームは、DeepSeekのリリースと同時に無料バリアントを確実に提供してきました。V3、V3.1、V3.2、そして今回のV4でもこのパターンが維持されています。&lt;/p&gt;

&lt;h3&gt;
  
  
  セットアップ
&lt;/h3&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;a href="https://openrouter.ai/" rel="noopener noreferrer"&gt;openrouter.ai&lt;/a&gt; でサインアップします。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Settings → Keys&lt;/strong&gt;からAPIキーを作成します。&lt;/li&gt;
&lt;li&gt;モデルカタログで&lt;code&gt;:free&lt;/code&gt;という接尾辞が付いたエントリ（通常は&lt;code&gt;deepseek/deepseek-v4-flash:free&lt;/code&gt;）を確認します。&lt;/li&gt;
&lt;li&gt;OpenAI互換SDKを使用してエンドポイントを呼び出します。
&lt;/li&gt;
&lt;/ol&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight python"&gt;&lt;code&gt;&lt;span class="kn"&gt;from&lt;/span&gt; &lt;span class="n"&gt;openai&lt;/span&gt; &lt;span class="kn"&gt;import&lt;/span&gt; &lt;span class="n"&gt;OpenAI&lt;/span&gt;

&lt;span class="n"&gt;client&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="nc"&gt;OpenAI&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="n"&gt;api_key&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="n"&gt;OPENROUTER_API_KEY&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;base_url&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;https://openrouter.ai/api/v1&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="n"&gt;response&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;client&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;chat&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;completions&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;create&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="n"&gt;model&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;deepseek/deepseek-v4-flash:free&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;messages&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;[{&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;role&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;user&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;content&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;Refactor this Go function to use channels.&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;}],&lt;/span&gt;
&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="nf"&gt;print&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;response&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;choices&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="mi"&gt;0&lt;/span&gt;&lt;span class="p"&gt;].&lt;/span&gt;&lt;span class="n"&gt;message&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;content&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h3&gt;
  
  
  制限の概要
&lt;/h3&gt;

&lt;p&gt;OpenRouterの無料枠リクエストは、負荷がかかると有料トラフィックの後ろにキューイングされます。一般的な制限は、キーあたり1日50〜200リクエスト程度で、同時実行数も厳しく制限されています。このバリアントは予告なくスロットリングされたり、消滅したりする可能性があります。これはプロトタイピングツールであり、本番環境のバックエンドではありません。&lt;/p&gt;

&lt;h3&gt;
  
  
  Node版
&lt;/h3&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight javascript"&gt;&lt;code&gt;&lt;span class="k"&gt;import&lt;/span&gt; &lt;span class="nx"&gt;OpenAI&lt;/span&gt; &lt;span class="k"&gt;from&lt;/span&gt; &lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;openai&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="p"&gt;;&lt;/span&gt;

&lt;span class="kd"&gt;const&lt;/span&gt; &lt;span class="nx"&gt;client&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="k"&gt;new&lt;/span&gt; &lt;span class="nc"&gt;OpenAI&lt;/span&gt;&lt;span class="p"&gt;({&lt;/span&gt;
  &lt;span class="na"&gt;apiKey&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="nx"&gt;process&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;env&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;OPENROUTER_API_KEY&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
  &lt;span class="na"&gt;baseURL&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;https://openrouter.ai/api/v1&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;span class="p"&gt;});&lt;/span&gt;

&lt;span class="kd"&gt;const&lt;/span&gt; &lt;span class="nx"&gt;response&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="k"&gt;await&lt;/span&gt; &lt;span class="nx"&gt;client&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;chat&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;completions&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;create&lt;/span&gt;&lt;span class="p"&gt;({&lt;/span&gt;
  &lt;span class="na"&gt;model&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;deepseek/deepseek-v4-flash:free&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
  &lt;span class="na"&gt;messages&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;[{&lt;/span&gt; &lt;span class="na"&gt;role&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;user&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="na"&gt;content&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;Explain MoE routing like I'm 12.&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt; &lt;span class="p"&gt;}],&lt;/span&gt;
&lt;span class="p"&gt;});&lt;/span&gt;

&lt;span class="nx"&gt;console&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;log&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="nx"&gt;response&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;choices&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="mi"&gt;0&lt;/span&gt;&lt;span class="p"&gt;].&lt;/span&gt;&lt;span class="nx"&gt;message&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;content&lt;/span&gt;&lt;span class="p"&gt;);&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h2&gt;
  
  
  パス2: Hugging Face推論プロバイダー
&lt;/h2&gt;

&lt;p&gt;Hugging Faceは、リリース後まもなくV4チェックポイントを公開する共有推論エンドポイントを運用しています。ログインしたHFトークンがあれば無料で呼び出せますが、レート制限は無料パスの中で最も厳しくなっています。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight python"&gt;&lt;code&gt;&lt;span class="kn"&gt;import&lt;/span&gt; &lt;span class="n"&gt;os&lt;/span&gt;
&lt;span class="kn"&gt;from&lt;/span&gt; &lt;span class="n"&gt;huggingface_hub&lt;/span&gt; &lt;span class="kn"&gt;import&lt;/span&gt; &lt;span class="n"&gt;InferenceClient&lt;/span&gt;

&lt;span class="n"&gt;client&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="nc"&gt;InferenceClient&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="n"&gt;model&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;deepseek-ai/DeepSeek-V4-Flash&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;token&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="n"&gt;os&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;environ&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;HF_TOKEN&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt;
&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="n"&gt;response&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;client&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;chat_completion&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="n"&gt;messages&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;
        &lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;role&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;user&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;content&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;Write a Python decorator that retries with jitter.&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;
    &lt;span class="p"&gt;],&lt;/span&gt;
    &lt;span class="n"&gt;max_tokens&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="mi"&gt;512&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="nf"&gt;print&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;response&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;choices&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="mi"&gt;0&lt;/span&gt;&lt;span class="p"&gt;].&lt;/span&gt;&lt;span class="n"&gt;message&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;content&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;HFトークンは&lt;a href="https://huggingface.co/settings/tokens" rel="noopener noreferrer"&gt;https://huggingface.co/settings/tokens&lt;/a&gt;で無料で取得できます。レイテンシーは負荷によって変動し、トークンはアカウントごとの共有日次予算にカウントされます。DeepSeekの有料APIを使用せずに制限を緩和するには、HF Proにアップグレードしてください。&lt;/p&gt;

&lt;h2&gt;
  
  
  パス3: Chutesとコミュニティゲートウェイ
&lt;/h2&gt;

&lt;p&gt;Chutesは、DeepSeekモデルを無料またはほぼ無料でホストすることが多い分散型GPUネットワークです。&lt;code&gt;https://llm.chutes.ai/v1&lt;/code&gt;でOpenAI互換のエンドポイントを公開しています。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight python"&gt;&lt;code&gt;&lt;span class="n"&gt;client&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="nc"&gt;OpenAI&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="n"&gt;api_key&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="n"&gt;CHUTES_API_KEY&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;base_url&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;https://llm.chutes.ai/v1&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="n"&gt;response&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;client&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;chat&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;completions&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;create&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="n"&gt;model&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;deepseek-ai/DeepSeek-V4-Flash&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;messages&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;[{&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;role&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;user&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;content&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;Compare CSA and HCA attention in two sentences.&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;}],&lt;/span&gt;
&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;利用可能性は急速に変化します。依存関係を構築する前に、必ずプロバイダーのダッシュボードで現在のモデルIDとコストを確認してください。&lt;/p&gt;

&lt;h2&gt;
  
  
  パス4: DeepSeekトライアルクレジット
&lt;/h2&gt;

&lt;p&gt;DeepSeekはこれまで、新規アカウントに少額のトライアルクレジットを付与してきました。金額と期間は変動し、メール認証後に1ドルが残高に加算されることもあります。サインアップ後には、必ず&lt;a href="https://platform.deepseek.com/" rel="noopener noreferrer"&gt;platform.deepseek.com&lt;/a&gt;の請求ダッシュボードを確認してください。&lt;/p&gt;

&lt;p&gt;V4の料金体系では、たとえ1ドルのトライアルでも十分に利用できます。1ドルでV4-Flashでは約700万入力トークン、V4-Proでは約57万入力トークンをカバーできます。これは、本番レベルのプロトタイプ呼び出しを数百回行うのに十分な量です。&lt;/p&gt;

&lt;h2&gt;
  
  
  Apidogでプロバイダーに依存しない無料チェーンを構築する
&lt;/h2&gt;

&lt;p&gt;複数の無料パスを使い分けることで、いずれかのプロバイダーがスロットリングされた場合にも自動的に切り替えられる堅牢なプロトタイプを構築できます。以下の手順でApidogを活用しましょう。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidogをダウンロード&lt;/a&gt;し、新しいプロジェクトを作成します。&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;openrouter&lt;/code&gt;, &lt;code&gt;huggingface&lt;/code&gt;, &lt;code&gt;chutes&lt;/code&gt;, &lt;code&gt;deepseek-trial&lt;/code&gt;の4つの環境を作成します。&lt;/li&gt;
&lt;li&gt;各環境で対応するAPIキーをシークレット変数として保存し、&lt;code&gt;BASE_URL&lt;/code&gt;を設定します。&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;{{BASE_URL}}/chat/completions&lt;/code&gt; へのPOSTリクエストを、パラメータ化された &lt;code&gt;model&lt;/code&gt; フィールドと共に保存します。&lt;/li&gt;
&lt;li&gt;環境切り替え機能を活用して、ワンクリックで同じプロンプトを全プロバイダーで再実行します。&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;同じアプローチは、対応する&lt;a href="http://apidog.com/blog/how-to-use-gpt-5-5-api-for-free?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;GPT-5.5 APIの無料パス&lt;/a&gt;にも応用可能です。コレクションをコピーしてプロバイダーを入れ替えるだけです。&lt;/p&gt;

&lt;h3&gt;
  
  
  コードでフォールバックチェーンを実装する
&lt;/h3&gt;

&lt;p&gt;無料プロバイダーがスロットリングされた場合、自動的に他のプロバイダーへフォールバックする仕組みをコードで実装できます。OpenAI SDK利用例:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight python"&gt;&lt;code&gt;&lt;span class="kn"&gt;import&lt;/span&gt; &lt;span class="n"&gt;os&lt;/span&gt;
&lt;span class="kn"&gt;from&lt;/span&gt; &lt;span class="n"&gt;openai&lt;/span&gt; &lt;span class="kn"&gt;import&lt;/span&gt; &lt;span class="n"&gt;OpenAI&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;RateLimitError&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;APIError&lt;/span&gt;

&lt;span class="n"&gt;PROVIDERS&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="p"&gt;[&lt;/span&gt;
    &lt;span class="p"&gt;{&lt;/span&gt;
        &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;base_url&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;https://openrouter.ai/api/v1&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
        &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;api_key&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="n"&gt;os&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;environ&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;OPENROUTER_API_KEY&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt;
        &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;model&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;deepseek/deepseek-v4-flash:free&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="p"&gt;},&lt;/span&gt;
    &lt;span class="p"&gt;{&lt;/span&gt;
        &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;base_url&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;https://llm.chutes.ai/v1&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
        &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;api_key&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="n"&gt;os&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;environ&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;CHUTES_API_KEY&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt;
        &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;model&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;deepseek-ai/DeepSeek-V4-Flash&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="p"&gt;},&lt;/span&gt;
    &lt;span class="p"&gt;{&lt;/span&gt;
        &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;base_url&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;https://api.deepseek.com/v1&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
        &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;api_key&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="n"&gt;os&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;environ&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;DEEPSEEK_API_KEY&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt;
        &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;model&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;deepseek-v4-flash&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="p"&gt;},&lt;/span&gt;
&lt;span class="p"&gt;]&lt;/span&gt;

&lt;span class="k"&gt;def&lt;/span&gt; &lt;span class="nf"&gt;call_v4&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;messages&lt;/span&gt;&lt;span class="p"&gt;):&lt;/span&gt;
    &lt;span class="k"&gt;for&lt;/span&gt; &lt;span class="n"&gt;provider&lt;/span&gt; &lt;span class="ow"&gt;in&lt;/span&gt; &lt;span class="n"&gt;PROVIDERS&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;
        &lt;span class="k"&gt;try&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;
            &lt;span class="n"&gt;client&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="nc"&gt;OpenAI&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
                &lt;span class="n"&gt;api_key&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="n"&gt;provider&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;api_key&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt;
                &lt;span class="n"&gt;base_url&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="n"&gt;provider&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;base_url&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt;
            &lt;span class="p"&gt;)&lt;/span&gt;
            &lt;span class="k"&gt;return&lt;/span&gt; &lt;span class="n"&gt;client&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;chat&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;completions&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;create&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
                &lt;span class="n"&gt;model&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="n"&gt;provider&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;model&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt;
                &lt;span class="n"&gt;messages&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="n"&gt;messages&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
            &lt;span class="p"&gt;)&lt;/span&gt;
        &lt;span class="nf"&gt;except &lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;RateLimitError&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;APIError&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt; &lt;span class="k"&gt;as&lt;/span&gt; &lt;span class="n"&gt;e&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;
            &lt;span class="nf"&gt;print&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="sa"&gt;f&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="si"&gt;{&lt;/span&gt;&lt;span class="n"&gt;provider&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="sh"&gt;'&lt;/span&gt;&lt;span class="s"&gt;base_url&lt;/span&gt;&lt;span class="sh"&gt;'&lt;/span&gt;&lt;span class="p"&gt;]&lt;/span&gt;&lt;span class="si"&gt;}&lt;/span&gt;&lt;span class="s"&gt; failed: &lt;/span&gt;&lt;span class="si"&gt;{&lt;/span&gt;&lt;span class="n"&gt;e&lt;/span&gt;&lt;span class="si"&gt;}&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
            &lt;span class="k"&gt;continue&lt;/span&gt;
    &lt;span class="k"&gt;raise&lt;/span&gt; &lt;span class="nc"&gt;RuntimeError&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;all providers exhausted&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h2&gt;
  
  
  各無料パスが実際に適している用途
&lt;/h2&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;パス&lt;/th&gt;
&lt;th&gt;最適な用途&lt;/th&gt;
&lt;th&gt;最悪な用途&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;OpenRouter無料&lt;/td&gt;
&lt;td&gt;プロトタイピング、日常開発&lt;/td&gt;
&lt;td&gt;厳格なSLAを持つあらゆる用途&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;HF推論&lt;/td&gt;
&lt;td&gt;探索的呼び出し、ノートブック&lt;/td&gt;
&lt;td&gt;低レイテンシーワークロード&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Chutes&lt;/td&gt;
&lt;td&gt;実験的なコミュニティ作業&lt;/td&gt;
&lt;td&gt;長期的な依存関係&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;DeepSeekトライアル&lt;/td&gt;
&lt;td&gt;完全な忠実度でのテスト&lt;/td&gt;
&lt;td&gt;持続的な本番稼働&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;セルフホスト型V4-Flash&lt;/td&gt;
&lt;td&gt;コンプライアンスが重視される作業&lt;/td&gt;
&lt;td&gt;GPU容量のないチーム&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;h2&gt;
  
  
  重要なクォータ計算
&lt;/h2&gt;

&lt;p&gt;いずれかの無料パスを利用する前に、日次スループットについて簡単な現実確認をしましょう。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;OpenRouter無料:&lt;/strong&gt; キーあたり1日約100リクエスト、各約5万トークン。1日あたり30〜50回の実際の開発呼び出しに役立つ可能性があります。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;HF推論無料:&lt;/strong&gt; 共有レート制限、アカウント全体で1日約1000リクエスト。負荷時には遅くなることもあります。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Chutes:&lt;/strong&gt; 変動あり。ベストエフォートとして扱ってください。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;DeepSeekトライアル (1ドル):&lt;/strong&gt; V4-Flashで、1回あたり1万入力トークンで約700回の呼び出しが可能。有限ですが、十分な量です。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;セルフホスト型V4-Flash:&lt;/strong&gt; ハードウェアによってスループットが制限されます。H100が4枚搭載されたマシンでは、50〜150トークン/秒を維持できます。&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;より多くの機能やスループットが必要な場合、有料APIの方が手間なく安価になるケースが多いです。V4-Flashで100万トークンあたり0.14ドルという料金では、2Kコンテキストと500出力トークンを持つ1万回の呼び出しで約2.80ドルかかります。&lt;/p&gt;

&lt;h2&gt;
  
  
  有料APIに移行するタイミング
&lt;/h2&gt;

&lt;p&gt;以下の3つの兆候があれば、無料枠では足りなくなったと言えます。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;レート制限が1日に複数回発生する。&lt;/li&gt;
&lt;li&gt;1つのワークロードをカバーするためだけに、複数の無料プロバイダーを連鎖させている。&lt;/li&gt;
&lt;li&gt;テストに予測可能なレイテンシーやSLAが必要である。&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;code&gt;platform.deepseek.com&lt;/code&gt;での最低チャージ額は2ドルです。無料枠での集中的なプロトタイピングは、有料APIが課金するよりも多くの開発時間を要することがよくあります。&lt;a href="http://apidog.com/blog/deepseek-v4-api-pricing?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeek V4料金ガイド&lt;/a&gt;で全料金表をご確認ください。&lt;/p&gt;

&lt;h2&gt;
  
  
  FAQ
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;これらのパスは永続的に無料ですか？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
いいえ。無料枠は予告なく変更されることがあります。これらはプロトタイピングツールとして扱い、本番環境のバックエンドとして使用しないでください。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;OpenRouterの&lt;code&gt;:free&lt;/code&gt;は本物のV4を実行しますか？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
はい、ただし厳格なレート制限のある共有インフラ上で動作します。品質は一致しますが、スループットはそうではありません。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;無料パスの出力を製品に使用できますか？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
各プロバイダーの規約を確認してください。OpenRouterはレート制限内で商用利用を許可しています。HF Inferenceは商用利用を許可していますが、厳しく制限されています。DeepSeek自身のトライアルクレジットは主要な規約に従います。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;どの無料パスが最高のレイテンシーを提供しますか？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
DeepSeek自身のトライアルクレジットです。本番環境のインフラを利用するためです。OpenRouterが次に続きます。HF InferenceとChutesは変動します。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;V4を無料でセルフホストできますか？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
ライセンスレベルではMITライセンスなので可能です。ハードウェアがコストとなります。&lt;a href="http://apidog.com/blog/how-to-run-deepseek-v4-locally?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeek V4をローカルで実行する方法&lt;/a&gt;でセットアップをご覧ください。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;今日どの無料パスを使い切ったか追跡するにはどうすればよいですか？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;を使用し、レスポンスビューアで&lt;code&gt;usage&lt;/code&gt;をピン留めしてください。ほとんどのアグリゲーターは、管理コンソールで利用状況ダッシュボードも公開しています。&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

</description>
    </item>
    <item>
      <title>DeepSeek V4 API 料金</title>
      <dc:creator>Akira</dc:creator>
      <pubDate>Fri, 24 Apr 2026 04:20:39 +0000</pubDate>
      <link>https://dev.to/aakira/deepseek-v4-api-liao-jin-45g7</link>
      <guid>https://dev.to/aakira/deepseek-v4-api-liao-jin-45g7</guid>
      <description>&lt;p&gt;DeepSeekは、2026年4月23日にV4シリーズの価格を発表し、AIモデルのコスト水準を大きく塗り替えました。V4-Flashは入力トークン100万あたり&lt;strong&gt;$0.14&lt;/strong&gt;、出力100万あたり&lt;strong&gt;$0.28&lt;/strong&gt;、V4-Proは入力&lt;strong&gt;$1.74&lt;/strong&gt;・出力&lt;strong&gt;$3.48&lt;/strong&gt;です。どちらも100万トークンのコンテキストウィンドウと最大384K出力トークンを持ち、繰り返しプロンプトに強いキャッシュヒット割引（80%–90%オフ）が自動適用されます。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;Apidogを今すぐ試す&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;このガイドでは、料金表の詳細、コンテキストキャッシュによるコスト削減、GPT-5.5やClaude Opusとのコスト比較、&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;で支出を予測管理する4つの実践的な方法を解説します。&lt;/p&gt;

&lt;p&gt;製品概要は&lt;a href="http://apidog.com/blog/what-is-deepseek-v4?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeek V4とは&lt;/a&gt;、APIの詳細は&lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeek V4 APIの使用方法&lt;/a&gt;、無料利用は&lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-for-free?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeek V4を無料で利用する方法&lt;/a&gt;を参照してください。&lt;/p&gt;

&lt;h2&gt;
  
  
  TL;DR
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;V4-Flash:&lt;/strong&gt; 入力 (キャッシュミス) $0.14/M、入力 (キャッシュヒット) $0.028/M、出力 $0.28/M&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;V4-Pro:&lt;/strong&gt; 入力 (キャッシュミス) $1.74/M、入力 (キャッシュヒット) $0.145/M、出力 $3.48/M&lt;/li&gt;
&lt;li&gt;コンテキストウィンドウ: 両モデルとも入力1M・出力384Kトークン&lt;/li&gt;
&lt;li&gt;キャッシュヒット割引: Flashで約80%オフ、Proで約92%オフ&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;deepseek-chat&lt;/code&gt;/&lt;code&gt;deepseek-reasoner&lt;/code&gt;は2026-07-24非推奨。料金はV4-Flashにマッピング&lt;/li&gt;
&lt;li&gt;キャッシュミス料金でV4-ProはGPT-5.5より入力約2.9倍・出力約8.6倍安い&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  完全な料金表
&lt;/h2&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;モデル&lt;/th&gt;
&lt;th&gt;入力 (キャッシュミス)&lt;/th&gt;
&lt;th&gt;入力 (キャッシュヒット)&lt;/th&gt;
&lt;th&gt;出力&lt;/th&gt;
&lt;th&gt;コンテキスト&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;deepseek-v4-flash&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;$0.14 / M&lt;/td&gt;
&lt;td&gt;$0.028 / M&lt;/td&gt;
&lt;td&gt;$0.28 / M&lt;/td&gt;
&lt;td&gt;1M / 384K&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;deepseek-v4-pro&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;$1.74 / M&lt;/td&gt;
&lt;td&gt;$0.145 / M&lt;/td&gt;
&lt;td&gt;$3.48 / M&lt;/td&gt;
&lt;td&gt;1M / 384K&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;
&lt;code&gt;deepseek-chat&lt;/code&gt; (2026-07-24非推奨)&lt;/td&gt;
&lt;td&gt;V4-Flash 非思考モードにマッピング&lt;/td&gt;
&lt;td&gt;—&lt;/td&gt;
&lt;td&gt;—&lt;/td&gt;
&lt;td&gt;—&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;
&lt;code&gt;deepseek-reasoner&lt;/code&gt; (2026-07-24非推奨)&lt;/td&gt;
&lt;td&gt;V4-Flash 思考モードにマッピング&lt;/td&gt;
&lt;td&gt;—&lt;/td&gt;
&lt;td&gt;—&lt;/td&gt;
&lt;td&gt;—&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;&lt;strong&gt;実装Tips:&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;モデルID (&lt;code&gt;deepseek-v4-flash&lt;/code&gt;/&lt;code&gt;deepseek-v4-pro&lt;/code&gt;)で料金が決まり、推論モードの違いは消費トークン量のみ。&lt;/li&gt;
&lt;li&gt;キャッシュヒット料金は設定不要、自動適用。1,024トークン以上の完全一致プレフィックスが対象。&lt;/li&gt;
&lt;li&gt;非推奨IDも内部でV4-Flashとして課金。API移行していなくても料金・品質はV4-Flash相当。&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  コンテキストキャッシングの仕組み
&lt;/h2&gt;

&lt;p&gt;DeepSeek V4の最大のコスト削減策はキャッシュです。繰り返し利用されるシステムプロンプトやRAGコンテキストを持つ場合、2回目以降の呼び出しは入力料金が大幅割引されます。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;例:&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;20,000トークンの固定プロンプト + 200トークンのユーザー質問 ×100回&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;キャッシングなし:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;入力: 100 × 20,200 × $1.74/M = $3.52&lt;/li&gt;
&lt;li&gt;出力: 100 × 500 × $3.48/M = $0.17&lt;/li&gt;
&lt;li&gt;合計: &lt;strong&gt;$3.69&lt;/strong&gt;
&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;キャッシングあり（最初のみミス、残りヒット）:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;最初: 20,200 × $1.74/M = $0.035&lt;/li&gt;
&lt;li&gt;99回分キャッシュヒット: 99 × 20,000 × $0.145/M = $0.287&lt;/li&gt;
&lt;li&gt;99回分ユーザー部分: 99 × 200 × $1.74/M = $0.034&lt;/li&gt;
&lt;li&gt;出力: 100 × 500 × $3.48/M = $0.174&lt;/li&gt;
&lt;li&gt;合計: &lt;strong&gt;$0.53&lt;/strong&gt;
&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;同じワークロードでコストは約1/7。&lt;/p&gt;

&lt;h2&gt;
  
  
  GPT-5.5・Claudeとのコスト比較
&lt;/h2&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;モデル&lt;/th&gt;
&lt;th&gt;入力 (通常)&lt;/th&gt;
&lt;th&gt;入力 (キャッシュ済み)&lt;/th&gt;
&lt;th&gt;出力&lt;/th&gt;
&lt;th&gt;コンテキスト&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;DeepSeek V4-Flash&lt;/td&gt;
&lt;td&gt;$0.14/M&lt;/td&gt;
&lt;td&gt;$0.028/M&lt;/td&gt;
&lt;td&gt;$0.28/M&lt;/td&gt;
&lt;td&gt;1M&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;DeepSeek V4-Pro&lt;/td&gt;
&lt;td&gt;$1.74/M&lt;/td&gt;
&lt;td&gt;$0.145/M&lt;/td&gt;
&lt;td&gt;$3.48/M&lt;/td&gt;
&lt;td&gt;1M&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;GPT-5.5&lt;/td&gt;
&lt;td&gt;$5/M&lt;/td&gt;
&lt;td&gt;$1.25/M&lt;/td&gt;
&lt;td&gt;$30/M&lt;/td&gt;
&lt;td&gt;1M&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;GPT-5.5 Pro&lt;/td&gt;
&lt;td&gt;$30/M&lt;/td&gt;
&lt;td&gt;—&lt;/td&gt;
&lt;td&gt;$180/M&lt;/td&gt;
&lt;td&gt;1M&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Claude Opus 4.6&lt;/td&gt;
&lt;td&gt;$15/M&lt;/td&gt;
&lt;td&gt;$1.50/M&lt;/td&gt;
&lt;td&gt;$75/M&lt;/td&gt;
&lt;td&gt;200K&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;出力コスト:&lt;/strong&gt; V4-ProはGPT-5.5の約1/8、Claude Opus 4.6の約1/21&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;キャッシュ入力:&lt;/strong&gt; V4-ProはGPT-5.5/Claudeの約1/10&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;性能:&lt;/strong&gt; LiveCodeBenchやCodeforcesでGPT-5.5同等以上、コストはごく一部&lt;/li&gt;
&lt;li&gt;注意: Claudeは長文検索、GeminiはMMLU-Proで一部優位&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  代表的ワークロードのコスト例（V4-Pro基準）
&lt;/h2&gt;

&lt;h3&gt;
  
  
  1. エージェントによるコーディングループ（50Kコンテキスト、2K出力、20回/タスク）
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;入力: 50,000 × 20 × $1.74 / M = $1.74&lt;/li&gt;
&lt;li&gt;出力: 2,000 × 20 × $3.48 / M = $0.14&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;タスクあたり: 約$1.88&lt;/strong&gt;（GPT-5.5なら約$6.20）&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  2. 長文ドキュメントQ&amp;amp;A（500Kコンテキスト、1K出力）
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;入力: 500,000 × $1.74 / M = $0.87&lt;/li&gt;
&lt;li&gt;出力: 1,000 × $3.48 / M = $0.003&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;呼び出しあたり: 約$0.87&lt;/strong&gt;（GPT-5.5なら約$2.53）&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  3. 大量分類（2Kコンテキスト、200出力、10,000回）※V4-Flash推奨
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;入力: 2,000 × 10,000 × $0.14/M = $2.80&lt;/li&gt;
&lt;li&gt;出力: 200 × 10,000 × $0.28/M = $0.56&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;合計: 約$3.36&lt;/strong&gt;（GPT-5.5なら約$110）&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  4. チャットボット（10Kプロンプト、500ユーザー・1K出力、1,000セッション）
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;初回入力: 10,500 × $1.74/M = $0.018&lt;/li&gt;
&lt;li&gt;キャッシュヒット入力: 999 × 10,000 × $0.145/M = $1.45&lt;/li&gt;
&lt;li&gt;キャッシュミスユーザー: 999 × 500 × $1.74/M = $0.87&lt;/li&gt;
&lt;li&gt;出力: 1,000 × 1,000 × $3.48/M = $3.48&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;合計: 約$5.82&lt;/strong&gt;（GPT-5.5なら約$26.35）&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  隠れコストに注意
&lt;/h2&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;思考モードのトークン爆発&lt;/strong&gt;
&lt;code&gt;thinking_max&lt;/code&gt;は非思考の3～10倍トークン消費。Think Maxは厳格にフラグ管理。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;コンテキストの膨張&lt;/strong&gt;
会話全履歴を毎ターン送ると1Mトークンに膨れがち。積極的に要約・トリミング推奨。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;自動リトライ地獄&lt;/strong&gt;
500エラーで無限リトライするとコストが倍増。指数バックオフ＋リトライ上限必須。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;開発時の無駄請求&lt;/strong&gt;
curl等で都度全コンテキスト送信するとコスト増。&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;なら変数置換で無駄な再送信を削減。&lt;/li&gt;
&lt;/ol&gt;

&lt;h2&gt;
  
  
  Apidogによるコストトラッキング
&lt;/h2&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidogをダウンロード&lt;/a&gt;し、&lt;code&gt;DEEPSEEK_API_KEY&lt;/code&gt;を環境ごとにシークレット変数登録
&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;https://api.deepseek.com/v1/chat/completions&lt;/code&gt; へのPOSTリクエストを保存
&lt;/li&gt;
&lt;li&gt;レスポンスパネルで &lt;code&gt;usage.prompt_tokens&lt;/code&gt;・&lt;code&gt;usage.completion_tokens&lt;/code&gt;・&lt;code&gt;usage.reasoning_tokens&lt;/code&gt; をピン留め
&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;model&lt;/code&gt;・&lt;code&gt;thinking_mode&lt;/code&gt;をパラメータ化し、V4-Flash/Proや思考モードのA/Bテストを容易に
&lt;/li&gt;
&lt;li&gt;GPT-5.5についても同様コレクションを作成（&lt;a href="http://apidog.com/blog/how-to-use-gpt-5-5-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;APIガイド&lt;/a&gt;参照）し、両プロバイダーのコスト比較が可能&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;このプロセスで、月末請求で驚く「謎のコスト」の約80%を事前に捕捉できます。&lt;/p&gt;

&lt;h2&gt;
  
  
  支出を予測可能にする4つのルール
&lt;/h2&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;V4-Flashをデフォルトに&lt;/strong&gt;
品質上必要な場合のみV4-Proへ切り替え&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;非思考モードをデフォルトに&lt;/strong&gt;
困難タスク時のみThink High、正確性重視時のみThink Maxを明示指定&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;&lt;code&gt;max_tokens&lt;/code&gt;は明示的に設定&lt;/strong&gt;
384K出力は上限値。実運用は2K程度が目安&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;トークン消費を毎回記録&lt;/strong&gt;
&lt;code&gt;prompt_tokens&lt;/code&gt;・&lt;code&gt;completion_tokens&lt;/code&gt;・&lt;code&gt;reasoning_tokens&lt;/code&gt;を全呼び出しでログ。推論トークン急増は設定ミスのシグナル&lt;/li&gt;
&lt;/ol&gt;

&lt;h2&gt;
  
  
  よくある質問
&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;Q. 無料枠はある？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
A. APIに無料枠はありませんが、新規アカウントにトライアルクレジットが付与される場合があります。API外の無料利用方法は&lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-for-free?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;こちら&lt;/a&gt;。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Q. キャッシュヒット料金は自動？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
A. はい。同一アカウント内で1,024トークン以上の完全一致プレフィックスは自動で割引。初回はミス料金、以後はヒット料金。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Q. 思考モードは高くつく？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
A. 1トークンあたりの料金は同じですが、推論トレースで消費トークンが増えます。&lt;code&gt;usage.reasoning_tokens&lt;/code&gt;の監視推奨。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Q. 料金は安定してる？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
A. DeepSeekは定期的に料金改定あり。V4は現時点で終了日未定。&lt;a href="https://api-docs.deepseek.com/quick_start/pricing?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;ライブ料金ページ&lt;/a&gt;で最新を要確認。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Q. V4-ProとV4-Flashで出力料金は同じ？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
A. 違います。Proは$3.48/M、Flashは$0.28/Mで12.4倍差。デフォルトはFlash推奨。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Q. Anthropic形式エンドポイントで料金は変わる？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
A. 変わりません。&lt;code&gt;https://api.deepseek.com/anthropic&lt;/code&gt;もOpenAI形式と同一料金です。&lt;/p&gt;

</description>
    </item>
    <item>
      <title>DeepSeek V4 API の使い方</title>
      <dc:creator>Akira</dc:creator>
      <pubDate>Fri, 24 Apr 2026 04:14:24 +0000</pubDate>
      <link>https://dev.to/aakira/deepseek-v4-api-noshi-ifang-3c7k</link>
      <guid>https://dev.to/aakira/deepseek-v4-api-noshi-ifang-3c7k</guid>
      <description>&lt;p&gt;DeepSeek V4は、リリース初日からAPIが利用可能です。モデルIDは&lt;code&gt;deepseek-v4-pro&lt;/code&gt;と&lt;code&gt;deepseek-v4-flash&lt;/code&gt;で、OpenAI互換エンドポイント（ベースURL：&lt;code&gt;https://api.deepseek.com&lt;/code&gt;）が提供されているため、既存のOpenAIクライアントはベースURLを変更するだけでそのまま利用できます。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;今すぐApidogを試そう&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-222.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-222.png" alt="" width="800" height="550"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;このガイドでは、認証、主要パラメータ、Python/Nodeの実装例、思考モードの挙動、ツール呼び出し、ストリーミング、そしてコスト可視化のための&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;ワークフローまで、開発・運用の実践手順を解説します。&lt;/p&gt;

&lt;p&gt;&amp;lt;!--kg-card-begin: html--&amp;gt;&lt;/p&gt;
&lt;br&gt;
        &lt;br&gt;
        &lt;br&gt;
    &amp;lt;!--kg-card-end: html--&amp;gt;

&lt;p&gt;製品概要は&lt;a href="http://apidog.com/blog/what-is-deepseek-v4" rel="noopener noreferrer"&gt;DeepSeek V4とは&lt;/a&gt;、無料利用方法は&lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-for-free" rel="noopener noreferrer"&gt;DeepSeek V4を無料で利用する方法&lt;/a&gt;を参照してください。&lt;/p&gt;

&lt;h2 id="%E8%A6%81%E7%B4%84"&gt;要約&lt;/h2&gt;

&lt;ul&gt;
  &lt;li&gt;DeepSeek V4は、&lt;code&gt;https://api.deepseek.com/v1/chat/completions&lt;/code&gt;（OpenAI互換）と&lt;code&gt;https://api.deepseek.com/anthropic&lt;/code&gt;（Anthropic互換）の2つのAPIエンドポイントで利用可能。&lt;/li&gt;
  &lt;li&gt;モデルID：&lt;code&gt;deepseek-v4-pro&lt;/code&gt;（合計1.6T/アクティブ49B）、&lt;code&gt;deepseek-v4-flash&lt;/code&gt;（合計284B/アクティブ13B）。&lt;/li&gt;
  &lt;li&gt;両モデルは&lt;strong&gt;1Mトークンコンテキスト&lt;/strong&gt;と3種の推論モード（&lt;code&gt;non-thinking&lt;/code&gt;／&lt;code&gt;thinking&lt;/code&gt;／&lt;code&gt;thinking_max&lt;/code&gt;）をサポート。&lt;/li&gt;
  &lt;li&gt;推奨パラメータは&lt;code&gt;temperature=1.0, top_p=1.0&lt;/code&gt;。OpenAI/GPT-5.5/Claudeのデフォルト値は避ける。&lt;/li&gt;
  &lt;li&gt;レガシーID（&lt;code&gt;deepseek-chat&lt;/code&gt;／&lt;code&gt;deepseek-reasoner&lt;/code&gt;）は&lt;strong&gt;2026年7月24日&lt;/strong&gt;に非推奨。移行必須。&lt;/li&gt;
  &lt;li&gt;リクエスト再実行や思考モード比較、APIキーの安全管理には&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidogダウンロード&lt;/a&gt;を推奨。&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-223.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-223.png" alt="" width="800" height="591"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2 id="%E5%89%8D%E6%8F%90%E6%9D%A1%E4%BB%B6"&gt;前提条件&lt;/h2&gt;

&lt;p&gt;初回リクエストまでに以下を準備してください。&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;
&lt;a href="https://platform.deepseek.com/" rel="noopener noreferrer"&gt;platform.deepseek.com&lt;/a&gt;で2ドル以上チャージしたDeepSeek開発者アカウント。残高不足時は&lt;code&gt;402 Insufficient Balance&lt;/code&gt;。&lt;/li&gt;
  &lt;li&gt;プロジェクトスコープのAPIキー。本番運用では必ずプロジェクトキーを利用。&lt;/li&gt;
  &lt;li&gt;OpenAI互換SDK（Python &lt;code&gt;openai&amp;gt;=1.30.0&lt;/code&gt;／Node &lt;code&gt;openai@4.x&lt;/code&gt;）。そのまま利用可能。&lt;/li&gt;
  &lt;li&gt;再実行・差分確認が容易なAPIクライアント。curlは単発向き、継続運用は&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;推奨。&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;APIキーのエクスポート例：&lt;/p&gt;

&lt;pre&gt;&lt;code&gt;export DEEPSEEK_API_KEY="sk-..."
&lt;/code&gt;&lt;/pre&gt;

&lt;h2 id="%E3%82%A8%E3%83%B3%E3%83%89%E3%83%9D%E3%82%A4%E3%83%B3%E3%83%88%E3%81%A8%E8%AA%8D%E8%A8%BC"&gt;エンドポイントと認証&lt;/h2&gt;

&lt;p&gt;選択肢は2つ。基本はOpenAI互換を推奨します。&lt;/p&gt;

&lt;pre&gt;&lt;code&gt;POST https://api.deepseek.com/v1/chat/completions    # OpenAI形式
POST https://api.deepseek.com/anthropic/v1/messages  # Anthropic形式
&lt;/code&gt;&lt;/pre&gt;

&lt;p&gt;認証は&lt;code&gt;Authorization: Bearer&lt;/code&gt;ヘッダーでAPIキーを渡します。最小構成のcurl例：&lt;/p&gt;

&lt;pre&gt;&lt;code&gt;curl https://api.deepseek.com/v1/chat/completions \
  -H "Authorization: Bearer $DEEPSEEK_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-v4-pro",
    "messages": [
      {"role": "user", "content": "Explain MoE routing in two sentences."}
    ]
  }'
&lt;/code&gt;&lt;/pre&gt;

&lt;p&gt;レスポンスはOpenAI標準：&lt;code&gt;choices&lt;/code&gt;配列、トークン消費量（&lt;code&gt;usage&lt;/code&gt;）、失敗時は&lt;code&gt;error.code&lt;/code&gt;と&lt;code&gt;error.message&lt;/code&gt;を含みます。&lt;/p&gt;

&lt;h2 id="%E3%83%AA%E3%82%AF%E3%82%A8%E3%82%B9%E3%83%88%E3%83%91%E3%83%A9%E3%83%A1%E3%83%BC%E3%82%BF"&gt;リクエストパラメータ&lt;/h2&gt;

&lt;p&gt;主要パラメータと型・推奨値：&lt;/p&gt;

&lt;p&gt;&amp;lt;!--kg-card-begin: html--&amp;gt;&lt;/p&gt;
&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;br&gt;
&lt;thead&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;th&gt;パラメータ&lt;/th&gt;
&lt;br&gt;
&lt;th&gt;型&lt;/th&gt;
&lt;br&gt;
&lt;th&gt;値&lt;/th&gt;
&lt;br&gt;
&lt;th&gt;注釈&lt;/th&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;/thead&gt;
&lt;br&gt;
&lt;tbody&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;td&gt;&lt;code&gt;model&lt;/code&gt;&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;string&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;
&lt;code&gt;deepseek-v4-pro&lt;/code&gt;, &lt;code&gt;deepseek-v4-flash&lt;/code&gt;
&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;必須。&lt;/td&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;td&gt;&lt;code&gt;messages&lt;/code&gt;&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;array&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;role/content ペア&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;必須。OpenAIと同じスキーマ。&lt;/td&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;td&gt;&lt;code&gt;thinking_mode&lt;/code&gt;&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;string&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;
&lt;code&gt;non-thinking&lt;/code&gt;, &lt;code&gt;thinking&lt;/code&gt;, &lt;code&gt;thinking_max&lt;/code&gt;
&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;デフォルトは&lt;code&gt;non-thinking&lt;/code&gt;。&lt;/td&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;td&gt;&lt;code&gt;temperature&lt;/code&gt;&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;float&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;0 から 2&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;DeepSeekは1.0を推奨。&lt;/td&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;td&gt;&lt;code&gt;top_p&lt;/code&gt;&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;float&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;0 から 1&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;DeepSeekは1.0を推奨。&lt;/td&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;td&gt;&lt;code&gt;max_tokens&lt;/code&gt;&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;int&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;1 から 131,072&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;出力長を制限。&lt;/td&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;td&gt;&lt;code&gt;stream&lt;/code&gt;&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;bool&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;true または false&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;SSEストリーミングを有効化。&lt;/td&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;td&gt;&lt;code&gt;tools&lt;/code&gt;&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;array&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;OpenAI ツール仕様&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;関数呼び出し用。&lt;/td&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;td&gt;&lt;code&gt;tool_choice&lt;/code&gt;&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;string または object&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;
&lt;code&gt;auto&lt;/code&gt;, &lt;code&gt;required&lt;/code&gt;, &lt;code&gt;none&lt;/code&gt;, または特定のツール&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;ツール使用を制御。&lt;/td&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;td&gt;&lt;code&gt;response_format&lt;/code&gt;&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;object&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;&lt;code&gt;{"type": "json_object"}&lt;/code&gt;&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;JSONモード出力。&lt;/td&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;td&gt;&lt;code&gt;seed&lt;/code&gt;&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;int&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;任意整数&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;再現性のため。&lt;/td&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;td&gt;&lt;code&gt;presence_penalty&lt;/code&gt;&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;float&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;-2 から 2&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;繰り返されるトピックにペナルティ。&lt;/td&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;td&gt;&lt;code&gt;frequency_penalty&lt;/code&gt;&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;float&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;-2 から 2&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;繰り返されるトークンにペナルティ。&lt;/td&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;/tbody&gt;
&lt;br&gt;
&lt;/table&gt;&lt;/div&gt;&amp;lt;!--kg-card-end: html--&amp;gt;

&lt;p&gt;&lt;code&gt;thinking_mode&lt;/code&gt;はコスト・速度・精度に直結します。&lt;br&gt;
- &lt;code&gt;non-thinking&lt;/code&gt;：推論トレースなし、最速・最安。&lt;br&gt;
- &lt;code&gt;thinking&lt;/code&gt;：追加トークン消費し、推論ブロックでコードや数値精度向上。&lt;br&gt;
- &lt;code&gt;thinking_max&lt;/code&gt;：最も多くのトークンを消費し、384K以上のコンテキスト推奨。&lt;/p&gt;

&lt;h2 id="python%E3%82%AF%E3%83%A9%E3%82%A4%E3%82%A2%E3%83%B3%E3%83%88"&gt;Pythonクライアント&lt;/h2&gt;

&lt;p&gt;OpenAI公式SDKでベースURLを指定するだけ。追加パラメータは&lt;code&gt;extra_body&lt;/code&gt;で渡す：&lt;/p&gt;

&lt;pre&gt;&lt;code&gt;import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["DEEPSEEK_API_KEY"],
    base_url="https://api.deepseek.com/v1",
)

response = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[
        {"role": "system", "content": "Reply in code only."},
        {"role": "user", "content": "Write a Rust function that debounces events."},
    ],
    extra_body={"thinking_mode": "thinking"},
    temperature=1.0,
    top_p=1.0,
    max_tokens=2048,
)

choice = response.choices[0]
print("Content:", choice.message.content)
print("Reasoning tokens:", response.usage.reasoning_tokens)
print("Total tokens:", response.usage.total_tokens)
&lt;/code&gt;&lt;/pre&gt;

&lt;p&gt;&lt;code&gt;extra_body&lt;/code&gt;でDeepSeek独自パラメータも柔軟に設定可能です。&lt;/p&gt;

&lt;h2 id="node%E3%82%AF%E3%83%A9%E3%82%A4%E3%82%A2%E3%83%B3%E3%83%88"&gt;Nodeクライアント&lt;/h2&gt;

&lt;p&gt;NodeのOpenAI SDKも同様。&lt;code&gt;thinking_mode&lt;/code&gt;等はトップレベルで渡す：&lt;/p&gt;

&lt;pre&gt;&lt;code&gt;import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.DEEPSEEK_API_KEY,
  baseURL: "https://api.deepseek.com/v1",
});

const response = await client.chat.completions.create({
  model: "deepseek-v4-flash",
  messages: [
    { role: "user", content: "Explain the Muon optimizer in plain English." },
  ],
  thinking_mode: "thinking",
  temperature: 1.0,
  top_p: 1.0,
});

console.log(response.choices[0].message.content);
console.log("Usage:", response.usage);
&lt;/code&gt;&lt;/pre&gt;

&lt;p&gt;Node SDKは未対応フィールドもエラーなく許容されます。&lt;/p&gt;

&lt;h2 id="%E3%82%B9%E3%83%88%E3%83%AA%E3%83%BC%E3%83%9F%E3%83%B3%E3%82%B0%E5%BF%9C%E7%AD%94"&gt;ストリーミング応答&lt;/h2&gt;

&lt;p&gt;&lt;code&gt;stream: true&lt;/code&gt;指定でSSEに。OpenAIと同じ形式：&lt;/p&gt;

&lt;pre&gt;&lt;code&gt;stream = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[{"role": "user", "content": "Stream a 300-word essay on MoE."}],
    stream=True,
    extra_body={"thinking_mode": "non-thinking"},
)

for chunk in stream:
    delta = chunk.choices[0].delta.content or ""
    print(delta, end="", flush=True)
&lt;/code&gt;&lt;/pre&gt;

&lt;p&gt;思考モード有効時は&lt;code&gt;delta.reasoning_content&lt;/code&gt;で推論トレースを受信可能。&lt;/p&gt;

&lt;h2 id="%E3%83%84%E3%83%BC%E3%83%AB%E5%91%BC%E3%81%B3%E5%87%BA%E3%81%97"&gt;ツール呼び出し&lt;/h2&gt;

&lt;p&gt;OpenAIツール呼び出しスキーマそのまま利用可。&lt;code&gt;tools&lt;/code&gt;配列で関数定義：&lt;/p&gt;

&lt;pre&gt;&lt;code&gt;tools = [{
    "type": "function",
    "function": {
        "name": "get_weather",
        "description": "Return the current weather for a city.",
        "parameters": {
            "type": "object",
            "properties": {
                "city": {"type": "string"},
                "unit": {"type": "string", "enum": ["c", "f"]},
            },
            "required": ["city"],
        },
    },
}]

response = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[{"role": "user", "content": "Weather in Lagos in Celsius?"}],
    tools=tools,
    tool_choice="auto",
    extra_body={"thinking_mode": "thinking"},
)

tool_call = response.choices[0].message.tool_calls[0]
print(tool_call.function.name, tool_call.function.arguments)
&lt;/code&gt;&lt;/pre&gt;

&lt;p&gt;呼び出した結果は&lt;code&gt;role: "tool"&lt;/code&gt;メッセージとして返し、ループ処理で実装。&lt;/p&gt;

&lt;h2 id="json%E3%83%A2%E3%83%BC%E3%83%89"&gt;JSONモード&lt;/h2&gt;

&lt;p&gt;構造化出力には&lt;code&gt;response_format&lt;/code&gt;で明示：&lt;/p&gt;

&lt;pre&gt;&lt;code&gt;response = client.chat.completions.create(
    model="deepseek-v4-flash",
    messages=[
        {"role": "system", "content": "Reply with a single JSON object."},
        {"role": "user", "content": "Summarize this release note as {title, date, bullets}: ..."},
    ],
    response_format={"type": "json_object"},
    extra_body={"thinking_mode": "non-thinking"},
)
&lt;/code&gt;&lt;/pre&gt;

&lt;p&gt;出力スキーマの厳密な検証はPydanticやZod等クライアント側でカバー。&lt;/p&gt;

&lt;h2 id="apidog%E3%81%A7%E3%82%B3%E3%83%AC%E3%82%AF%E3%82%B7%E3%83%A7%E3%83%B3%E3%82%92%E6%A7%8B%E7%AF%89%E3%81%99%E3%82%8B"&gt;Apidogでコレクションを構築する&lt;/h2&gt;

&lt;p&gt;APIクレジット消費と差分比較を最小化するためのワークフロー例：&lt;/p&gt;

&lt;ol&gt;
  &lt;li&gt;
&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidogをダウンロード&lt;/a&gt;しプロジェクト作成。&lt;/li&gt;
  &lt;li&gt;
&lt;code&gt;{{DEEPSEEK_API_KEY}}&lt;/code&gt;を秘密変数として登録。&lt;/li&gt;
  &lt;li&gt;
&lt;code&gt;Authorization: Bearer {{DEEPSEEK_API_KEY}}&lt;/code&gt;ヘッダー付きで&lt;code&gt;{{BASE_URL}}/chat/completions&lt;/code&gt;にPOSTリクエスト保存。&lt;/li&gt;
  &lt;li&gt;
&lt;code&gt;model&lt;/code&gt;と&lt;code&gt;thinking_mode&lt;/code&gt;をパラメータ化し、A/Bテストを柔軟に。&lt;/li&gt;
  &lt;li&gt;各実行で&lt;code&gt;usage.reasoning_tokens&lt;/code&gt;をビジュアルに確認し、コスト最適化。&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;既存の&lt;a href="http://apidog.com/blog/how-to-use-gpt-5-5-api" rel="noopener noreferrer"&gt;GPT-5.5 APIコレクション&lt;/a&gt;と同様に、ベースURLとモデルIDだけ切り替えることで即座に比較検証が可能です。&lt;/p&gt;

&lt;h2 id="%E3%82%A8%E3%83%A9%E3%83%BC%E5%87%A6%E7%90%86"&gt;エラー処理&lt;/h2&gt;

&lt;p&gt;OpenAI準拠のエンベロープ。主要なエラーと対応策：&lt;/p&gt;

&lt;p&gt;&amp;lt;!--kg-card-begin: html--&amp;gt;&lt;/p&gt;
&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;br&gt;
&lt;thead&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;th&gt;コード&lt;/th&gt;
&lt;br&gt;
&lt;th&gt;意味&lt;/th&gt;
&lt;br&gt;
&lt;th&gt;修正&lt;/th&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;/thead&gt;
&lt;br&gt;
&lt;tbody&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;td&gt;400&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;不正なリクエスト&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;JSONスキーマ、特に&lt;code&gt;messages&lt;/code&gt;と&lt;code&gt;tools&lt;/code&gt;を確認してください。&lt;/td&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;td&gt;401&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;無効なキー&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;
&lt;a href="https://platform.deepseek.com/" rel="noopener noreferrer"&gt;platform.deepseek.com&lt;/a&gt;で再生成してください。&lt;/td&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;td&gt;402&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;残高不足&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;アカウントにチャージしてください。&lt;/td&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;td&gt;403&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;モデルが許可されていません&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;キーのスコープとモデルIDのスペルを確認してください。&lt;/td&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;td&gt;422&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;パラメータが範囲外です&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;おそらく&lt;code&gt;max_tokens&lt;/code&gt;または&lt;code&gt;thinking_mode&lt;/code&gt;が一致していません。&lt;/td&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;td&gt;429&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;レート制限&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;時間を置いてから、指数的なジッターで再試行してください。&lt;/td&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;/tbody&gt;
&lt;tbody&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;td&gt;500&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;サーバーエラー&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;一度再試行してください。繰り返す場合はステータスページを確認してください。&lt;/td&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;td&gt;503&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;過負荷&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;V4-Flashにフォールバックするか、30秒後に再試行してください。&lt;/td&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;/tbody&gt;
&lt;br&gt;
&lt;/table&gt;&lt;/div&gt;&amp;lt;!--kg-card-end: html--&amp;gt;

&lt;p&gt;429・5xx系は指数バックオフ付きリトライ、4xxは論理バグなので自動リトライしないこと。&lt;/p&gt;

&lt;h2 id="%E3%82%B3%E3%82%B9%E3%83%88%E7%AE%A1%E7%90%86%E3%83%91%E3%82%BF%E3%83%BC%E3%83%B3"&gt;コスト管理パターン&lt;/h2&gt;

&lt;p&gt;コスト予測と最適化のための運用パターン：&lt;/p&gt;

&lt;ol&gt;
  &lt;li&gt;
&lt;strong&gt;デフォルトはV4-Flash利用。&lt;/strong&gt; 品質差分が明確な場合のみV4-Pro適用。&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;&lt;code&gt;thinking_max&lt;/code&gt;は機能フラグで制御。&lt;/strong&gt; 正確性重視時のみ利用し、無制限運用は避ける。&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;&lt;code&gt;max_tokens&lt;/code&gt;で出力上限設定。&lt;/strong&gt; 通常2,000トークンで十分。1Mウィンドウは入力用。&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;全リクエストで&lt;code&gt;usage&lt;/code&gt;を必ずログ化。&lt;/strong&gt; 推論トークン数の急増時にアラート設定。&lt;/li&gt;
&lt;/ol&gt;

&lt;h2 id="%E5%8F%A4%E3%81%84deepseek%E3%83%A2%E3%83%87%E3%83%AB%E3%81%8B%E3%82%89%E3%81%AE%E7%A7%BB%E8%A1%8C"&gt;古いDeepSeekモデルからの移行&lt;/h2&gt;

&lt;p&gt;レガシーIDは非推奨。移行はモデルIDの1行差分のみ：&lt;/p&gt;

&lt;pre&gt;&lt;code&gt;-  model="deepseek-chat"
+  model="deepseek-v4-pro"
&lt;/code&gt;&lt;/pre&gt;

&lt;p&gt;本番移行前はApidogでA/B比較推奨。非推奨期限までに切り替え必須です。&lt;/p&gt;

&lt;h2 id="%E3%82%88%E3%81%8F%E3%81%82%E3%82%8B%E8%B3%AA%E5%95%8F"&gt;よくある質問&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;DeepSeek V4 APIは本番対応？&lt;/strong&gt; はい。2026年4月23日公開済み。インフラはV3世代から継続利用。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Anthropic形式もサポート？&lt;/strong&gt; はい。&lt;code&gt;https://api.deepseek.com/anthropic/v1/messages&lt;/code&gt;で同じ基盤モデルにアクセス可能。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;コンテキストウィンドウは？&lt;/strong&gt; 両モデルとも100万トークン。&lt;code&gt;thinking_max&lt;/code&gt;は384K以上推奨。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;入力トークンの事前カウント方法は？&lt;/strong&gt; OpenAIトークナイザー推奨。正確値は&lt;code&gt;usage&lt;/code&gt;で返却。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;APIでファインチューニング可能？&lt;/strong&gt; 現時点では不可。Hugging Face経由の自己ホストBaseチェックポイントのみ対応。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;無料トライアルは？&lt;/strong&gt; アカウントレベルでの無料枠はなし。新規登録時に試用クレジット提供の場合あり。&lt;/p&gt;

</description>
    </item>
    <item>
      <title>DeepSeek V4 の使い方：ウェブチャット、API、セルフホストの方法</title>
      <dc:creator>Akira</dc:creator>
      <pubDate>Fri, 24 Apr 2026 04:12:36 +0000</pubDate>
      <link>https://dev.to/aakira/deepseek-v4-noshi-ifang-uebutiyatuto-api-seruhuhosutonofang-fa-3p3e</link>
      <guid>https://dev.to/aakira/deepseek-v4-noshi-ifang-uebutiyatuto-api-seruhuhosutonofang-fa-3p3e</guid>
      <description>&lt;p&gt;DeepSeek V4は2026年4月23日に、4つのチェックポイント、ライブAPI、そしてHugging Face上のMITライセンスのウェイトと共にリリースされました。この組み合わせは、単一の「正しい」使用方法がないことを意味します。最適なパスは、即座のアクセス、本番APIコール、またはオンプレミスデプロイメントのいずれを望むかによって異なります。このガイドでは、これら3つすべてについて、トレードオフ、落とし穴、そして再利用可能な本番対応プロンプトワークフローを説明します。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;今すぐApidogを試す&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;製品レベルの概要だけを知りたい場合は、まず&lt;a href="http://apidog.com/blog/what-is-deepseek-v4?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeek V4とは何か&lt;/a&gt;をお読みください。純粋なAPIのウォークスルーについては、&lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeek V4 APIガイド&lt;/a&gt;をご覧ください。費用のかからないパスについては、&lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-for-free?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeek V4を無料で使う方法&lt;/a&gt;をご覧ください。実際の要求をテストする準備ができたら、&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;を入手し、コレクションを事前に構築してください。&lt;/p&gt;

&lt;h2 id="要約"&gt;要約&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;最速パス: &lt;a href="https://chat.deepseek.com/" rel="noopener noreferrer"&gt;chat.deepseek.com&lt;/a&gt;。無料ウェブチャット、V4-Proがデフォルト、3つの推論モード。&lt;/li&gt;
&lt;li&gt;本番パス: モデルID &lt;code&gt;deepseek-v4-pro&lt;/code&gt; または &lt;code&gt;deepseek-v4-flash&lt;/code&gt; を用いた &lt;code&gt;https://api.deepseek.com/v1/chat/completions&lt;/code&gt;。&lt;/li&gt;
&lt;li&gt;セルフホストパス: &lt;a href="https://huggingface.co/collections/deepseek-ai/deepseek-v4" rel="noopener noreferrer"&gt;Hugging Face&lt;/a&gt;からウェイトをプルし、リポジトリ内の&lt;code&gt;/inference&lt;/code&gt;スクリプトを実行。&lt;/li&gt;
&lt;li&gt;ルーティングと分類には&lt;strong&gt;Non-Think&lt;/strong&gt;、コードと分析には&lt;strong&gt;Think High&lt;/strong&gt;、精度がコストよりも重要な場合にのみ&lt;strong&gt;Think Max&lt;/strong&gt;を選択してください。&lt;/li&gt;
&lt;li&gt;DeepSeekからのサンプリング推奨: &lt;code&gt;temperature=1.0, top_p=1.0&lt;/code&gt;。これを疑ってはいけません。&lt;/li&gt;
&lt;li&gt;APIクライアントとして&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;を使用してください。OpenAI互換の形式は、保存されたリクエストがDeepSeek、OpenAI、Anthropic間で再利用可能であることを意味します。&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-220.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-220.png" alt="DeepSeek V4はAPI、ウェブチャット、およびセルフホストモデルを介して利用可能です。" width="800" height="550"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2 id="ワークロードに適したパスを選択する"&gt;ワークロードに適したパスを選択する&lt;/h2&gt;

&lt;p&gt;実現可能な4つのパスがあります。それぞれ異なる状況で優位性を発揮します。&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;パス&lt;/th&gt;
&lt;th&gt;コスト&lt;/th&gt;
&lt;th&gt;セットアップ時間&lt;/th&gt;
&lt;th&gt;最適用途&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;a href="http://chat.deepseek.com" rel="noopener noreferrer"&gt;chat.deepseek.com&lt;/a&gt;&lt;/td&gt;
&lt;td&gt;無料&lt;/td&gt;
&lt;td&gt;30秒&lt;/td&gt;
&lt;td&gt;クイックテスト、アドホックな作業&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;DeepSeek API&lt;/td&gt;
&lt;td&gt;トークンごとの課金&lt;/td&gt;
&lt;td&gt;5分&lt;/td&gt;
&lt;td&gt;本番、エージェント、バッチ処理&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;セルフホスト型V4-Flash&lt;/td&gt;
&lt;td&gt;ハードウェアコストのみ&lt;/td&gt;
&lt;td&gt;数時間&lt;/td&gt;
&lt;td&gt;オンプレミスコンプライアンス、オフライン推論&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;セルフホスト型V4-Pro&lt;/td&gt;
&lt;td&gt;クラスタコストのみ&lt;/td&gt;
&lt;td&gt;1日&lt;/td&gt;
&lt;td&gt;研究、カスタムファインチューニング&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;OpenRouter / アグリゲーター&lt;/td&gt;
&lt;td&gt;トークンごとの課金&lt;/td&gt;
&lt;td&gt;2分&lt;/td&gt;
&lt;td&gt;複数プロバイダーフォールバック&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;h2 id="パス1-ウェブチャットでv4を使用する"&gt;パス1: ウェブチャットでV4を使用する&lt;/h2&gt;

&lt;p&gt;DeepSeek V4を最速で体験するには、公式チャットUIを使います。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;a href="https://chat.deepseek.com/" rel="noopener noreferrer"&gt;chat.deepseek.com&lt;/a&gt;にアクセス&lt;/li&gt;
&lt;li&gt;メール、Google、WeChatのいずれかでサインイン&lt;/li&gt;
&lt;li&gt;デフォルトはV4-Pro。コンポーザー上部のトグルで、Non-Think、Think High、Think Maxを切り替え&lt;/li&gt;
&lt;li&gt;入力してAIに指示&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-221.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-221.png" alt="思考モードセレクターを備えたDeepSeek chat.deepseek.comウェブチャット" width="800" height="434"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;ウェブチャットはファイルアップロード、ウェブ検索、最大1Mトークンのコンテキストをサポートします。アカウント単位でレート制限がありますが、完全なブロックはほぼありません。&lt;br&gt;
◎適した用途: エラートレースの診断、PDF要約、他AIとの比較ベンチマーク&lt;br&gt;
✕不向き: 自動化や再現性が必要な処理&lt;/p&gt;

&lt;h2 id="パス2-deepseek-apiを使用する"&gt;パス2: DeepSeek APIを使用する&lt;/h2&gt;

&lt;p&gt;API経由で本番導入や自動化を行う場合の具体手順です。&lt;/p&gt;

&lt;h3 id="キーを取得する"&gt;キーを取得する&lt;/h3&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;a href="https://platform.deepseek.com/" rel="noopener noreferrer"&gt;platform.deepseek.com&lt;/a&gt;でサインアップ&lt;/li&gt;
&lt;li&gt;支払い情報を追加（最低2ドル）&lt;/li&gt;
&lt;li&gt;「API Keys」からAPIキーを1回だけコピー&lt;/li&gt;
&lt;/ol&gt;

&lt;pre&gt;&lt;code&gt;export DEEPSEEK_API_KEY="sk-..."&lt;/code&gt;&lt;/pre&gt;

&lt;h3 id="最小限の有効なリクエスト"&gt;最小限の有効なリクエスト&lt;/h3&gt;

&lt;pre&gt;&lt;code&gt;curl https://api.deepseek.com/v1/chat/completions \
  -H "Authorization: Bearer $DEEPSEEK_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-v4-pro",
    "messages": [
      {"role": "user", "content": "Refactor this Python function to async. Reply with code only."}
    ],
    "thinking_mode": "thinking"
  }'
&lt;/code&gt;&lt;/pre&gt;

&lt;p&gt;コスト重視なら&lt;code&gt;deepseek-v4-flash&lt;/code&gt;、高速化なら&lt;code&gt;thinking_mode&lt;/code&gt;を&lt;code&gt;non-thinking&lt;/code&gt;に切り替えてください。&lt;/p&gt;

&lt;h3 id="pythonクライアント"&gt;Pythonクライアント&lt;/h3&gt;

&lt;p&gt;OpenAI SDKと同じインターフェースで利用できます。LangChainやLlamaIndex、DSPyもそのまま動作。&lt;/p&gt;

&lt;pre&gt;&lt;code&gt;import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["DEEPSEEK_API_KEY"],
    base_url="https://api.deepseek.com/v1",
)

response = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[
        {"role": "system", "content": "You are a concise senior engineer."},
        {"role": "user", "content": "Explain the CSA+HCA hybrid attention stack."},
    ],
    extra_body={"thinking_mode": "thinking_max"},
    temperature=1.0,
    top_p=1.0,
)

print(response.choices[0].message.content)
&lt;/code&gt;&lt;/pre&gt;

&lt;h3 id="nodeクライアント"&gt;Nodeクライアント&lt;/h3&gt;

&lt;pre&gt;&lt;code&gt;import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.DEEPSEEK_API_KEY,
  baseURL: "https://api.deepseek.com/v1",
});

const response = await client.chat.completions.create({
  model: "deepseek-v4-flash",
  messages: [{ role: "user", content: "Write a fizzbuzz in Rust." }],
  temperature: 1.0,
  top_p: 1.0,
});

console.log(response.choices[0].message.content);
&lt;/code&gt;&lt;/pre&gt;

&lt;p&gt;詳細やエラーハンドリングは&lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeek V4 APIガイド&lt;/a&gt;を参照してください。&lt;/p&gt;

&lt;h2 id="パス3-apidogで反復する"&gt;パス3: Apidogで反復する&lt;/h2&gt;

&lt;p&gt;Curlや手動リクエストは1回きりなら良いですが、反復や比較、再利用にはApidogを使うと圧倒的に効率的です。&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;Mac/Windows/Linux向けの&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;をダウンロード&lt;/li&gt;
&lt;li&gt;新規APIプロジェクトを作成、POSTリクエストで&lt;code&gt;https://api.deepseek.com/v1/chat/completions&lt;/code&gt;を追加&lt;/li&gt;
&lt;li&gt;ヘッダーに&lt;code&gt;Authorization: Bearer {{DEEPSEEK_API_KEY}}&lt;/code&gt;を追加し、キーは環境変数に保存&lt;/li&gt;
&lt;li&gt;JSONリクエストボディを貼り付けて保存、以降はワンクリックで再実行や編集が可能&lt;/li&gt;
&lt;li&gt;応答ビューアでNon-Think/Think Maxの比較や推論トレースをチェック&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;OpenAI/Claude/DeepSeekリクエストを同じコレクションで管理可能。A/Bテストも容易で、課金状況も一元化されます。既存の&lt;a href="http://apidog.com/blog/how-to-use-gpt-5-5-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;GPT-5.5 APIコレクション&lt;/a&gt;もベースURLの変更だけで流用できます。&lt;/p&gt;

&lt;h2 id="パス4-v4-flashをセルフホストする"&gt;パス4: V4-Flashをセルフホストする&lt;/h2&gt;

&lt;p&gt;オンプレミス要件やコスト最適化が必要な場合、MITライセンスのV4はセルフホスト可能です。&lt;/p&gt;

&lt;h3 id="ハードウェア"&gt;ハードウェア要件&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;V4-Flash:&lt;/strong&gt; FP8時はH100/H200/MI300Xを2〜4枚。INT4量子化なら80GB GPU 1枚で動作可能。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;V4-Pro:&lt;/strong&gt; 本番利用には16〜32枚のH100クラスGPUが必要。&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id="ウェイトを取得する"&gt;ウェイトを取得する&lt;/h3&gt;

&lt;pre&gt;&lt;code&gt;pip install -U "huggingface_hub[cli]"
huggingface-cli login  # 必要に応じて
huggingface-cli download deepseek-ai/DeepSeek-V4-Flash \
  --local-dir ./models/deepseek-v4-flash \
  --local-dir-use-symlinks False
&lt;/code&gt;&lt;/pre&gt;

&lt;p&gt;V4-FlashはFP8で約500GB、V4-Proは数TB規模です。&lt;/p&gt;

&lt;h3 id="推論を実行する"&gt;推論を実行する&lt;/h3&gt;

&lt;pre&gt;&lt;code&gt;pip install "vllm&amp;gt;=0.9.0"

vllm serve deepseek-ai/DeepSeek-V4-Flash \
  --tensor-parallel-size 4 \
  --max-model-len 1048576 \
  --dtype auto
&lt;/code&gt;&lt;/pre&gt;

&lt;p&gt;vLLM起動後、OpenAI互換クライアントのベースURLを&lt;code&gt;http://localhost:8000/v1&lt;/code&gt;に設定します。Apidogでも同じコレクションを流用できます。&lt;/p&gt;

&lt;h2 id="v4を効果的にプロンプトする"&gt;V4を効果的にプロンプトする&lt;/h2&gt;

&lt;p&gt;DeepSeek V4で最大効果を得るためのプロンプト設計:&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;必ず&lt;code&gt;thinking_mode&lt;/code&gt;を明示指定。&lt;/strong&gt;用途に応じてNon-Think/Think High/Think Maxを切り替える。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;システムプロンプトはペルソナ用、タスクはユーザーメッセージに。&lt;/strong&gt;仕様はsystemではなくuserに記述。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;コード生成時はテストケースを一緒に与える。&lt;/strong&gt;例：失敗するテストコードや期待値を含めると精度が向上。&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;長文コンテキスト利用時は、重要な資料を冒頭/末尾に配置することで注意力バイアスを活用できます。&lt;/p&gt;

&lt;h2 id="コスト管理"&gt;コスト管理&lt;/h2&gt;

&lt;p&gt;コスト暴走を防止する実践的な3つのガードレール:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;まずはV4-Flash＋Non-Thinkモードをデフォルトに設定&lt;/li&gt;
&lt;li&gt;難易度に応じてThink High・Think Maxへ段階的に切替&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;max_tokens&lt;/code&gt;で出力上限を明示設定（1Mは上限、通常は2000程度で十分）&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Apidogの環境変数でAPIキーを分離し、テストと本番の課金アカウントを分けて管理。&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;はトークン数も記録でき、プロンプト肥大化も可視化できます。&lt;/p&gt;

&lt;h2 id="deepseek-v3または他のモデルからの移行"&gt;DeepSeek V3または他のモデルからの移行&lt;/h2&gt;

&lt;p&gt;既存のワークフローをV4へ速やかに移行する方法:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;&lt;code&gt;deepseek-chat&lt;/code&gt; / &lt;code&gt;deepseek-reasoner&lt;/code&gt;から:&lt;/strong&gt; モデルIDを&lt;code&gt;deepseek-v4-pro&lt;/code&gt;または&lt;code&gt;deepseek-v4-flash&lt;/code&gt;に変更。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;OpenAI GPT-5.xから:&lt;/strong&gt; ベースURLを&lt;code&gt;https://api.deepseek.com/v1&lt;/code&gt;に、モデルIDをv4系に。形式やパラレルリクエストは&lt;a href="http://apidog.com/blog/how-to-use-gpt-5-5-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;GPT-5.5 APIガイド&lt;/a&gt;を参照。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Anthropic Claudeから:&lt;/strong&gt; Anthropic形式維持なら&lt;code&gt;https://api.deepseek.com/anthropic&lt;/code&gt;、OpenAI形式に変換しても利用可能。&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id="よくある質問"&gt;よくある質問&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;V4を使用するには有料アカウントが必要ですか？&lt;/strong&gt;&lt;br&gt;
ウェブチャットは無料。APIは最低2ドルから。無料利用方法は&lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-for-free?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;こちら&lt;/a&gt;。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;どのバリアントをデフォルトにすべき？&lt;/strong&gt;&lt;br&gt;
まずはV4-Flash＋Non-Thinkでスタート、必要に応じて上位モードへ。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;MacBookでV4は動く？&lt;/strong&gt;&lt;br&gt;
V4-Flashは重い量子化でM3 Max/M4 Maxの128GBメモリ搭載機で動作可（低速）。V4-Proは不可。軽量実験はAPIやウェブチャット推奨。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;ツール利用や関数呼び出しは？&lt;/strong&gt;&lt;br&gt;
OpenAI互換エンドポイントは&lt;code&gt;tools&lt;/code&gt;配列・&lt;code&gt;tool_calls&lt;/code&gt;に対応。Anthropic形式もネイティブ対応。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;応答ストリーミングは？&lt;/strong&gt;&lt;br&gt;
リクエストボディで&lt;code&gt;stream: true&lt;/code&gt;を指定。OpenAIストリーミング対応ライブラリでそのまま利用可能。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;レート制限は？&lt;/strong&gt;&lt;br&gt;
APIは&lt;a href="https://api-docs.deepseek.com/" rel="noopener noreferrer"&gt;api-docs.deepseek.com&lt;/a&gt;で制限を公開。セルフホストはハードウェア上限のみ。&lt;/p&gt;

</description>
    </item>
    <item>
      <title>DeepSeek V4とは？</title>
      <dc:creator>Akira</dc:creator>
      <pubDate>Fri, 24 Apr 2026 04:10:06 +0000</pubDate>
      <link>https://dev.to/aakira/deepseek-v4toha-49ld</link>
      <guid>https://dev.to/aakira/deepseek-v4toha-49ld</guid>
      <description>&lt;p&gt;DeepSeekは2026年4月23日にV4をリリースしました。これは軽微なポイントリリースではありません。杭州の研究室は、DeepSeek-V4-Proを筆頭に、合計1.6兆のパラメーター、MITライセンス、100万トークンのコンテキストウィンドウを持つ4つのチェックポイントを一度に公開しました。より小型の兄弟モデルであるDeepSeek-V4-Flashは、2,840億のパラメーターを持ち、同じコンテキストとオープンウェイトを備えています。ベンチマークでは、Pro版はLiveCodeBenchとCodeforcesでClaude Opus 4.6を上回り、MMLU-ProではGPT-5.4 xHighに肉薄しています。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;Apidogを今すぐ試す&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;DeepSeek V4にClaude、GPT-5.5、またはQwenを置き換えるかどうかを検討している場合、このガイドでは、モデルがどのようなものか、V3.2から何が変わったか、ベンチマークの結果を左右するアーキテクチャの選択、そして今日どこで実行できるかを解説します。&lt;/p&gt;

&lt;p&gt;開発者向けの対応するチュートリアルとして、&lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeek V4 APIガイド&lt;/a&gt;、&lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-for-free?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;無料アクセスガイド&lt;/a&gt;、および完全な&lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeek V4使用チュートリアル&lt;/a&gt;を用意しています。リクエスト形式はOpenAIのフォーマットにきれいにマッピングされるため、APIキーが届く前に&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;でコレクションを事前に構築できます。&lt;/p&gt;

&lt;h2&gt;
  
  
  要約
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;DeepSeek V4&lt;/strong&gt;は2026年4月23日に&lt;strong&gt;MITライセンス&lt;/strong&gt;でリリースされたMixture-of-Expertsファミリーです。&lt;/li&gt;
&lt;li&gt;リリース時には、&lt;strong&gt;V4-Pro&lt;/strong&gt;、&lt;strong&gt;V4-Pro-Base&lt;/strong&gt;、&lt;strong&gt;V4-Flash&lt;/strong&gt;、&lt;strong&gt;V4-Flash-Base&lt;/strong&gt;の4つのチェックポイントが公開されています。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;V4-Pro&lt;/strong&gt;は合計1.6兆パラメーター（アクティブ490億）、&lt;strong&gt;V4-Flash&lt;/strong&gt;は2,840億パラメーター（アクティブ130億）。&lt;/li&gt;
&lt;li&gt;両バリアントとも&lt;strong&gt;100万トークンのコンテキストウィンドウ&lt;/strong&gt;、推論モードはNon-Think、Think High、Think Maxの3種。&lt;/li&gt;
&lt;li&gt;主要ベンチマーク: &lt;strong&gt;LiveCodeBench 93.5&lt;/strong&gt;、&lt;strong&gt;Codeforces 3206&lt;/strong&gt;、&lt;strong&gt;MMLU-Pro 87.5&lt;/strong&gt;（Proバリアント）。&lt;/li&gt;
&lt;li&gt;APIは&lt;code&gt;api.deepseek.com&lt;/code&gt;で稼働中、モデルIDは&lt;code&gt;deepseek-v4-pro&lt;/code&gt;と&lt;code&gt;deepseek-v4-flash&lt;/code&gt;。ウェイトはHugging FaceとModelScopeで公開。&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  DeepSeek V4の概要
&lt;/h2&gt;

&lt;p&gt;DeepSeek V4はV3/V3.2シリーズの後継であり、アーキテクチャは引き続きMixture-of-Experts。ただしパラメーター構成が大きく変わっています。V4-Proは1.6兆パラメーターのうち、実際に計算するのは490億のみ。そのため大規模パラメーターモデルでありながら、実行コストは500億パラメータ級の密モデルに近いです。詳細な技術情報は&lt;a href="https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro" rel="noopener noreferrer"&gt;DeepSeek V4モデルカード&lt;/a&gt;を参照してください。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fpejjjliky55psxexo3l2.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fpejjjliky55psxexo3l2.png" alt="DeepSeek V4モデルカードの概要" width="800" height="158"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;リリース時の4つのチェックポイント:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;DeepSeek-V4-Pro&lt;/strong&gt; — 主力モデル。1.6兆総パラメータ、アクティブ490億、コンテキスト100万。API利用の中心。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;DeepSeek-V4-Pro-Base&lt;/strong&gt; — ファインチューニングや研究用のプレーンな事前学習済みモデル。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;DeepSeek-V4-Flash&lt;/strong&gt; — 軽量バリアント。2,840億総パラメータ、アクティブ130億。同じ100万トークンのコンテキスト。低レイテンシやローカル展開向き。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;DeepSeek-V4-Flash-Base&lt;/strong&gt; — Flash用ベースモデル。&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;4つ全てMITライセンスでリリース。GPT-5.5やClaude Opus 4.6はクローズドでAPI利用に高額課金が必要ですが、DeepSeek V4-Proは完全オープンウェイト。ダウンロード、ファインチューニング、社内デプロイも自由です。&lt;/p&gt;

&lt;h2&gt;
  
  
  V3.2からの主な変更点
&lt;/h2&gt;

&lt;p&gt;V4はアテンションスタック、トレーニングパイプラインを刷新し、長文コンテキスト・効率性を同時に向上。&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;機能&lt;/th&gt;
&lt;th&gt;V3.2&lt;/th&gt;
&lt;th&gt;V4-Pro&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;総パラメーター数&lt;/td&gt;
&lt;td&gt;6850億&lt;/td&gt;
&lt;td&gt;&lt;strong&gt;1.6兆&lt;/strong&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;アクティブパラメーター&lt;/td&gt;
&lt;td&gt;370億&lt;/td&gt;
&lt;td&gt;&lt;strong&gt;490億&lt;/strong&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;コンテキストウィンドウ&lt;/td&gt;
&lt;td&gt;12.8万&lt;/td&gt;
&lt;td&gt;&lt;strong&gt;100万&lt;/strong&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;推論FLOPs（100万CT）&lt;/td&gt;
&lt;td&gt;基準値&lt;/td&gt;
&lt;td&gt;V3.2の&lt;strong&gt;27%&lt;/strong&gt;
&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;KVキャッシュ（100万CT）&lt;/td&gt;
&lt;td&gt;基準値&lt;/td&gt;
&lt;td&gt;V3.2の&lt;strong&gt;10%&lt;/strong&gt;
&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;精度&lt;/td&gt;
&lt;td&gt;FP8&lt;/td&gt;
&lt;td&gt;&lt;strong&gt;FP4 + FP8混合&lt;/strong&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;ライセンス&lt;/td&gt;
&lt;td&gt;DeepSeek独自&lt;/td&gt;
&lt;td&gt;&lt;strong&gt;MIT&lt;/strong&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;推論モード&lt;/td&gt;
&lt;td&gt;シングル&lt;/td&gt;
&lt;td&gt;&lt;strong&gt;3種&lt;/strong&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;ポイントとなる改良:&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;新ハイブリッドアテンション&lt;/strong&gt;（Compressed Sparse + Heavily Compressed Attention）：KVキャッシュの大幅圧縮を実現。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Manifold-Constrained Hyper-Connections&lt;/strong&gt;：より深いネットワークの安定化。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Muonオプティマイザー&lt;/strong&gt;：高速収束と大規模MoE向け勾配制御。&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F0ohkm6y7q9i5q2swecu2.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F0ohkm6y7q9i5q2swecu2.png" alt="DeepSeek V4アーキテクチャの概要" width="800" height="550"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  主要ベンチマーク
&lt;/h2&gt;

&lt;p&gt;V4-Proはコーディング・知識系でトップクラス。長文検索はClaudeに劣る部分も。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fqn2q9hlfiouvipu8z13b.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fqn2q9hlfiouvipu8z13b.png" alt="DeepSeek V4-Pro対Claude対GPT-5.5のベンチマーク" width="800" height="591"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;V4-Flashは&lt;strong&gt;MMLU-Pro 86.2&lt;/strong&gt;、&lt;strong&gt;GPQA Diamond 88.1&lt;/strong&gt;、&lt;strong&gt;LiveCodeBench 91.6&lt;/strong&gt;、&lt;strong&gt;Codeforces 3052&lt;/strong&gt;、&lt;strong&gt;SWE Verified 79.0&lt;/strong&gt;と、130億アクティブパラメータで最先端。自社運用・ローカル展開にも適しています。&lt;a href="https://huggingface.co/deepseek-ai/DeepSeek-V4-Flash" rel="noopener noreferrer"&gt;全ベンチマーク表はこちら&lt;/a&gt;。&lt;/p&gt;

&lt;p&gt;用途ごとの選択ポイント：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;コーディング/オープンエンドな推論：V4-Pro&lt;/li&gt;
&lt;li&gt;100万トークン検索：Claude Opus&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  3つの推論モード
&lt;/h2&gt;

&lt;p&gt;V4系すべてのチェックポイントで3モード選択可。API/ローカル推論で&lt;code&gt;thinking_mode&lt;/code&gt;パラメータを指定。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Non-Think&lt;/strong&gt;：高速。分類・ルーティング・要約などレイテンシ重視用途に。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Think High&lt;/strong&gt;：難易度高めの作業向け。推論トークンを出力、ツール計画や出力確認あり。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Think Max&lt;/strong&gt;：より長い推論トレース、自己批判的。コンテキスト38.4万トークン以上推奨。コスト増だが最高性能。&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;サンプリング推奨値は全モード共通で&lt;code&gt;temperature=1.0, top_p=1.0&lt;/code&gt;。&lt;/p&gt;

&lt;h2&gt;
  
  
  アーキテクチャの要点（分かりやすく）
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;ハイブリッドアテンション&lt;/strong&gt;：主要層でCompressed Sparse Attention、一部でHeavily Compressed Attentionを採用。少数の重要トークンに集中的アテンション、それ以外は圧縮。これで計算・メモリ効率を実現。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;多様体制約型ハイパーコネクション&lt;/strong&gt;：残差接続を多様体制約下で安定化。深層でも勾配爆発・消失を防ぐ。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Muonオプティマイザー&lt;/strong&gt;：AdamWより高速収束、大規模MoEの勾配制御に最適。&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;これらの組み合わせにより、超大規模で安定したトレーニング・推論が可能。&lt;/p&gt;

&lt;h2&gt;
  
  
  現在の利用可能性
&lt;/h2&gt;

&lt;p&gt;2026年4月24日時点での利用状況：&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;サービス&lt;/th&gt;
&lt;th&gt;アクセス方法&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;a href="https://chat.deepseek.com/" rel="noopener noreferrer"&gt;chat.deepseek.com&lt;/a&gt;&lt;/td&gt;
&lt;td&gt;無料ウェブチャット（V4-Proデフォルト、要ログイン）&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;DeepSeek API&lt;/td&gt;
&lt;td&gt;
&lt;code&gt;api.deepseek.com&lt;/code&gt;、モデルIDは&lt;code&gt;deepseek-v4-pro&lt;/code&gt;/&lt;code&gt;deepseek-v4-flash&lt;/code&gt;
&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Hugging Faceウェイト&lt;/td&gt;
&lt;td&gt;
&lt;a href="https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro" rel="noopener noreferrer"&gt;V4-Pro&lt;/a&gt;、&lt;a href="https://huggingface.co/deepseek-ai/DeepSeek-V4-Flash" rel="noopener noreferrer"&gt;V4-Flash&lt;/a&gt;
&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;ModelScope&lt;/td&gt;
&lt;td&gt;中国向けミラーウェイト&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;OpenRouter等&lt;/td&gt;
&lt;td&gt;数日中に対応予定&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;
&lt;code&gt;deepseek-chat&lt;/code&gt;/&lt;code&gt;deepseek-reasoner&lt;/code&gt;
&lt;/td&gt;
&lt;td&gt;2026年7月24日非推奨&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;&lt;strong&gt;注意&lt;/strong&gt;：&lt;code&gt;deepseek-chat&lt;/code&gt;を使用中の場合、3ヶ月以内に&lt;code&gt;deepseek-v4-pro&lt;/code&gt;/&lt;code&gt;deepseek-v4-flash&lt;/code&gt;へ移行が必要です。&lt;/p&gt;

&lt;h2&gt;
  
  
  GPT-5.5・Claudeとの実践比較
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;コスト&lt;/strong&gt;：V4系はオープンウェイト、セルフホスト可能。大規模利用では有料APIより遥かに安価に。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;コーディング&lt;/strong&gt;：V4-ProはLiveCodeBench/CodeforcesでGPT-5.5やClaude Opusを上回る。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;知識幅&lt;/strong&gt;：Gemini 3.1 ProがMMLU-Proでトップ（91.0）、V4-ProとGPT-5.5は87.5。SimpleQA-VerifiedではV4が他社を大きく引き離す。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;長文検索&lt;/strong&gt;：Claude OpusがMRCR 1Mで最上位。100万トークンの高精度検索用途はClaudeが無難。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;ライセンス&lt;/strong&gt;：MITなので商用組み込みも自由。&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  DeepSeek V4に適した用途
&lt;/h2&gt;

&lt;ol&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;エージェント的コーディングループ&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
SWE Verified 79.0、Codeforces 3206の性能で、大規模デバッグ/リファクタ/自動テスト修正が可能。&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;のようなAPIクライアントと組み合わせてプロンプト・レスポンスを管理。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;長文ドキュメント推論&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
100万トークン = 契約書や研究コーパスを丸ごと処理可能。Think Highモード推奨。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;セルフホストAI製品&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
オンプレミス/プライバシー重視の要件で、V4-FlashはクローズドAPIと同等の品質をオープンウェイトで実現。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;研究・ファインチューニング&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
ベースチェックポイントでカスタムSFTやRLHF。MITライセンスなので商用成果物も配布可能。&lt;/p&gt;&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;strong&gt;適さない用途&lt;/strong&gt;：大量分類・埋め込み検索・短文チャット用途はV4-Flashでもオーバースペック。従来のDeepSeekモデル推奨。&lt;/p&gt;

&lt;h2&gt;
  
  
  価格情報
&lt;/h2&gt;

&lt;p&gt;2026年4月時点でAPI料金表は未公表。V3.2は入力100万トークン=0.28ドル、出力100万トークン=0.42ドル。V4系も同等または若干上の水準予想。競合API（GPT-5.5/Claude）は5〜15ドル/100万トークンなので、V4が3倍値上がりしても十分安価。最新価格は&lt;a href="https://api-docs.deepseek.com/" rel="noopener noreferrer"&gt;DeepSeekの料金ページ&lt;/a&gt;で確認。&lt;/p&gt;

&lt;h2&gt;
  
  
  今日V4をテストする方法
&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;最短で試す3つの方法：&lt;/strong&gt;&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;ウェブチャット&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
&lt;a href="https://chat.deepseek.com/" rel="noopener noreferrer"&gt;chat.deepseek.com&lt;/a&gt;にサインイン。V4-Proがデフォルト。UIでThink Highに切替可能。無料・カード不要。&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;API&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
APIキー取得後、クライアントを&lt;code&gt;https://api.deepseek.com&lt;/code&gt;に設定し、&lt;code&gt;"model": "deepseek-v4-pro"&lt;/code&gt;でリクエスト（OpenAI互換）。OpenAIクライアントはベースURLを変えるだけで利用可。詳細は&lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;APIガイド&lt;/a&gt;参照。&lt;br&gt;
&lt;/p&gt;&lt;/li&gt;
&lt;/ol&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight json"&gt;&lt;code&gt;&lt;span class="w"&gt;   &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
     &lt;/span&gt;&lt;span class="nl"&gt;"model"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"deepseek-v4-pro"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
     &lt;/span&gt;&lt;span class="nl"&gt;"messages"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="w"&gt;
       &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="nl"&gt;"role"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"system"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nl"&gt;"content"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"あなたは有能なAIアシスタントです。"&lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;&lt;span class="w"&gt;
       &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="nl"&gt;"role"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"user"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nl"&gt;"content"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"DeepSeek V4の特徴を教えてください。"&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
     &lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt;&lt;span class="w"&gt;
     &lt;/span&gt;&lt;span class="nl"&gt;"thinking_mode"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"think_high"&lt;/span&gt;&lt;span class="w"&gt;
   &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;ローカルウェイト&lt;/strong&gt;
Hugging FaceまたはModelScopeからモデル取得。V4-Flashは2〜4台のH100で動作、V4-Proは大規模クラスタ必須。推論コードはリポジトリの&lt;code&gt;/inference&lt;/code&gt;にあり。&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;プロンプト反復を含むハンズオンは&lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeek V4の使用方法&lt;/a&gt;、無料運用は&lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-for-free?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;無料運用ガイド&lt;/a&gt;を参照。&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidogをダウンロード&lt;/a&gt;して事前にコレクション構築も可能です。OpenAI互換フォーマットなので、DeepSeek・OpenAI・他APIでも同一リクエストが使えます。&lt;/p&gt;

&lt;h2&gt;
  
  
  よくある質問
&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;Q: DeepSeek V4は本当にオープンソースですか？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
A: はい。4つの全モデルにMITライセンスが付与されており、商用利用・改変・再配布も制限なし。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Q: V4-Flashを動かすにはGPUクラスタが必要？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
A: フル精度ならH100/H200が2～4台。量子化でさらに少ないGPUでも可。V4-Proは大規模クラスタ必須。ハードウェアなしならAPIや&lt;a href="https://chat.deepseek.com/" rel="noopener noreferrer"&gt;chat.deepseek.com&lt;/a&gt;利用を。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Q: APIではいつ利用可能？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
A: 2026年4月23日から&lt;code&gt;deepseek-v4-pro&lt;/code&gt;/&lt;code&gt;deepseek-v4-flash&lt;/code&gt;で稼働中。&lt;code&gt;deepseek-chat&lt;/code&gt;/&lt;code&gt;deepseek-reasoner&lt;/code&gt;は7月24日非推奨化。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Q: KimiやQwenと比較すると？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
A: V4-ProはKimi K2・Qwen 3 MaxよりLiveCodeBench/Codeforcesで高スコア。全てオープンウェイトMoE系統。用途に合うベンチマークで判断を。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Q: 自社データでファインチューニング可能？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
A: 可能。ベースモデル＋自社データ＋標準SFTパイプラインでOK。MITライセンスなので商用配布も可。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Q: OpenAI互換ツールで使える？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
A: はい。API（&lt;code&gt;https://api.deepseek.com&lt;/code&gt;）はOpenAI形式、&lt;code&gt;/anthropic&lt;/code&gt;はAnthropic形式に対応。ほとんどのOpenAIクライアントはベースURL変更だけで利用可能。参考: &lt;a href="http://apidog.com/blog/how-to-use-gpt-5-5-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;GPT-5.5 APIウォークスルー&lt;/a&gt;。&lt;/p&gt;

</description>
    </item>
    <item>
      <title>GPT-5.5 価格: API、Codex、ChatGPT 費用を徹底解説 (2026年4月)</title>
      <dc:creator>Akira</dc:creator>
      <pubDate>Fri, 24 Apr 2026 02:26:50 +0000</pubDate>
      <link>https://dev.to/aakira/gpt-55-jia-ge-api-codex-chatgpt-fei-yong-woche-di-jie-shuo-2026nian-4yue--1b44</link>
      <guid>https://dev.to/aakira/gpt-55-jia-ge-api-codex-chatgpt-fei-yong-woche-di-jie-shuo-2026nian-4yue--1b44</guid>
      <description>&lt;p&gt;OpenAIは2026年4月23日にGPT-5.5をリリースし、GPT-5シリーズのトークン単価を2倍に引き上げました。入力は100万トークンあたり2.50ドルから5.00ドル、出力は100万トークンあたり15.00ドルから30.00ドルです。Proプランの価格（30ドル/180ドル）は据え置きですが、実際のコスト構造は分かりづらいものとなっています。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;Apidog を今すぐ試そう&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;このガイドでは、APIの各料金プラン（スタンダード、バッチ、フレックス、プライオリティ）、Proの体系、Codex各プランの制限、デフォルトモデル変更前のコスト計算手順について、開発者向けに実装面から解説します。&lt;/p&gt;

&lt;p&gt;モデルの詳細は&lt;a href="http://apidog.com/blog/what-is-gpt-5-5?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;GPT-5.5とは&lt;/a&gt;、API利用手順は&lt;a href="http://apidog.com/blog/how-to-use-gpt-5-5-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;GPT-5.5 APIの使用方法&lt;/a&gt;を参照してください。&lt;/p&gt;

&lt;h2 id="tldr-要点"&gt;TL;DR (要点)&lt;/h2&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;プラン&lt;/th&gt;
&lt;th&gt;入力 / 100万&lt;/th&gt;
&lt;th&gt;出力 / 100万&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;GPT-5.5 標準API&lt;/td&gt;
&lt;td&gt;$5.00&lt;/td&gt;
&lt;td&gt;$30.00&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;GPT-5.5 Pro API&lt;/td&gt;
&lt;td&gt;$30.00&lt;/td&gt;
&lt;td&gt;$180.00&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;GPT-5.5 バッチ (50%オフ)&lt;/td&gt;
&lt;td&gt;$2.50&lt;/td&gt;
&lt;td&gt;$15.00&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;GPT-5.5 フレックス (50%オフ)&lt;/td&gt;
&lt;td&gt;$2.50&lt;/td&gt;
&lt;td&gt;$15.00&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;GPT-5.5 プライオリティ (2.5倍)&lt;/td&gt;
&lt;td&gt;$12.50&lt;/td&gt;
&lt;td&gt;$75.00&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;GPT-5.4 標準API&lt;/td&gt;
&lt;td&gt;$2.50&lt;/td&gt;
&lt;td&gt;$15.00&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;GPT-5.4-mini API&lt;/td&gt;
&lt;td&gt;$0.25&lt;/td&gt;
&lt;td&gt;$2.00&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;ポイント：GPT-5.5はトークン単位でGPT-5.4の2倍の価格。OpenAIは「Intelligence-Index」向上（約20%）をアピールしていますが、使い方次第でコストインパクトが変わります。&lt;/p&gt;

&lt;h2 id="主要な数字"&gt;主要な数字&lt;/h2&gt;

&lt;p&gt;OpenAIは&lt;a href="https://openai.com/api/pricing/" rel="noopener noreferrer"&gt;API料金ページ&lt;/a&gt;で価格を公開しています。&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;
&lt;strong&gt;GPT-5.5:&lt;/strong&gt; 入力100万トークンあたり5.00ドル、出力100万トークンあたり30.00ドル。&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;GPT-5.5 Pro:&lt;/strong&gt; 入力100万トークンあたり30.00ドル、出力100万トークンあたり180.00ドル。&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;コンテキストウィンドウ:&lt;/strong&gt; 両バリアントで100万トークン。推論トークンはウィンドウ＋出力課金両方にカウント。&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id="バッチ、フレックス、プライオリティ"&gt;バッチ、フレックス、プライオリティ&lt;/h2&gt;

&lt;p&gt;標準API以外にも、コスト削減・性能最適化のための3つのティアがあります。&lt;/p&gt;

&lt;h3 id="バッチapi"&gt;バッチAPI&lt;/h3&gt;

&lt;p&gt;リクエストをバッチエンドポイントでキューに入れると、標準料金の50%で利用可能。処理は最大24時間以内。適用例:&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;全データセットの夜間バッチ評価&lt;/li&gt;
  &lt;li&gt;バックフィルや過去データの再処理&lt;/li&gt;
  &lt;li&gt;レイテンシー許容幅が秒単位でなく時間単位のワークフロー&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;バッチ利用時、GPT-5.5は100万トークンあたり2.50ドル/15.00ドル。GPT-5.4の標準料金と同等。オフライン処理ではコスト増なし。&lt;/p&gt;

&lt;h3 id="フレックス処理"&gt;フレックス処理&lt;/h3&gt;

&lt;p&gt;フレックスも標準の半額ですが、待機時間は数秒～数分と変動。レイテンシーに余裕があり、バッチ並みの料金でほぼ即時応答が欲しい場合に適しています。&lt;/p&gt;

&lt;h3 id="プライオリティ処理"&gt;プライオリティ処理&lt;/h3&gt;

&lt;p&gt;標準の2.5倍料金（GPT-5.5なら100万トークンあたり12.50ドル/75.00ドル）。スループット・レートリミット強化、キュー待ちほぼゼロ。ユーザー体験に直結するリアルタイム用途向け。&lt;/p&gt;

&lt;h2 id="思考モードのコスト計算"&gt;思考モードのコスト計算&lt;/h2&gt;

&lt;p&gt;GPT-5.5の思考モードは同一モデルIDに&lt;code&gt;reasoning.effort&lt;/code&gt;パラメータを指定する方式。トークン単価は同じですが、リクエストごとの消費トークンが増加します。乗数は以下の通り:&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;労力&lt;/th&gt;
&lt;th&gt;出力トークン乗数&lt;/th&gt;
&lt;th&gt;使用場面&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;
&lt;code&gt;low&lt;/code&gt; (デフォルト)&lt;/td&gt;
&lt;td&gt;1倍&lt;/td&gt;
&lt;td&gt;一般的なルーチン&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;medium&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;1.3–2倍&lt;/td&gt;
&lt;td&gt;多段階コーディング、構造的生成&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;high&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;2–4倍&lt;/td&gt;
&lt;td&gt;詳細調査、正確なレビュー&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;xhigh&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;3–8倍&lt;/td&gt;
&lt;td&gt;エージェントループ、計画タスク&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;例：&lt;code&gt;xhigh&lt;/code&gt;指定で推論トークン2万消費する場合、出力課金だけでなく推論にも0.60ドルかかります（100万トークンあたり30ドルの場合）。&lt;/p&gt;

&lt;p&gt;リクエスト単位の見積もりでなく、ワークロード全体で予算を組みましょう。&lt;/p&gt;

&lt;h2 id="Codexの料金体系"&gt;Codexの料金体系&lt;/h2&gt;

&lt;p&gt;Codexはトークン従量課金ではなく、ChatGPTのサブスクリプションプランに紐付きます。2026年4月23日時点の構造：&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;プラン&lt;/th&gt;
&lt;th&gt;Codexアクセス&lt;/th&gt;
&lt;th&gt;GPT-5.5&lt;/th&gt;
&lt;th&gt;備考&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;Free&lt;/td&gt;
&lt;td&gt;あり（一時的）&lt;/td&gt;
&lt;td&gt;あり&lt;/td&gt;
&lt;td&gt;週単位で厳格な制限&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Go&lt;/td&gt;
&lt;td&gt;あり（一時的）&lt;/td&gt;
&lt;td&gt;あり&lt;/td&gt;
&lt;td&gt;Freeの2倍制限&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Plus ($20 / 月)&lt;/td&gt;
&lt;td&gt;あり&lt;/td&gt;
&lt;td&gt;あり&lt;/td&gt;
&lt;td&gt;標準的な制限&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Pro ($200 / 月)&lt;/td&gt;
&lt;td&gt;あり&lt;/td&gt;
&lt;td&gt;あり + Thinking + Pro(ChatGPT内)&lt;/td&gt;
&lt;td&gt;最大制限&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Business&lt;/td&gt;
&lt;td&gt;あり&lt;/td&gt;
&lt;td&gt;あり&lt;/td&gt;
&lt;td&gt;シート単位&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Enterprise / Edu&lt;/td&gt;
&lt;td&gt;あり&lt;/td&gt;
&lt;td&gt;あり&lt;/td&gt;
&lt;td&gt;契約ベース&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;CLIベースのコーディング中心ユーザーなら、PlusやProが最も安価。1日数十万トークンを超える場合、バッチAPIより月額サブスクリプションが有利です。&lt;a href="http://apidog.com/blog/how-to-use-gpt-5-5-free-codex?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;無料パスガイド&lt;/a&gt;でコストゼロのエントリーポイントをチェック。&lt;/p&gt;

&lt;h2 id="比較-gpt-55と他のモデル"&gt;比較: GPT-5.5と他のモデル&lt;/h2&gt;

&lt;p&gt;GPT-5.5のコストを払うべきか、GPT-5.4系で十分かは、ワークロードの性質（出力重視かどうか）で決まります。&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;モデル&lt;/th&gt;
&lt;th&gt;入力 / 100万&lt;/th&gt;
&lt;th&gt;出力 / 100万&lt;/th&gt;
&lt;th&gt;出力トークン1,000あたりのコスト&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;GPT-5.4-mini&lt;/td&gt;
&lt;td&gt;$0.25&lt;/td&gt;
&lt;td&gt;$2.00&lt;/td&gt;
&lt;td&gt;$0.0020&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;GPT-5.4&lt;/td&gt;
&lt;td&gt;$2.50&lt;/td&gt;
&lt;td&gt;$15.00&lt;/td&gt;
&lt;td&gt;$0.0150&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;GPT-5.5&lt;/td&gt;
&lt;td&gt;$5.00&lt;/td&gt;
&lt;td&gt;$30.00&lt;/td&gt;
&lt;td&gt;$0.0300&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;GPT-5.5 Pro&lt;/td&gt;
&lt;td&gt;$30.00&lt;/td&gt;
&lt;td&gt;$180.00&lt;/td&gt;
&lt;td&gt;$0.1800&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;選定フロー例：&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;大量・低リスク出力（分類/要約/簡単なチャット）→ &lt;strong&gt;GPT-5.4-mini&lt;/strong&gt;
&lt;/li&gt;
  &lt;li&gt;5.4で十分な品質の本番用途→ &lt;strong&gt;GPT-5.4&lt;/strong&gt;
&lt;/li&gt;
  &lt;li&gt;難度の高いコーディングや研究チェーン→ &lt;strong&gt;GPT-5.5&lt;/strong&gt;
&lt;/li&gt;
  &lt;li&gt;正確さ重視・失敗コスト大→ &lt;strong&gt;GPT-5.5 Pro&lt;/strong&gt;
&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id="実践例-コーディングエージェントのタスクあたりのコスト"&gt;実践例: コーディングエージェントのタスクコスト&lt;/h2&gt;

&lt;p&gt;APIで&lt;code&gt;reasoning.effort: "medium"&lt;/code&gt;を指定した自律コーディングセッション例：&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;入力トークン（リポジトリ＋ユーザープロンプト）：約15,000&lt;/li&gt;
  &lt;li&gt;出力トークン（コード＋説明）：約3,000&lt;/li&gt;
  &lt;li&gt;推論トークン（medium設定）：約6,000&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;標準料金でのコスト計算：&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;入力: 15K × $5.00 / 100万 = $0.075&lt;/li&gt;
  &lt;li&gt;出力: (3K + 6K) × $30.00 / 100万 = $0.27&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;合計: 1タスクあたり$0.345&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;同条件でGPT-5.4の場合：&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;入力: 15K × $2.50 / 100万 = $0.0375&lt;/li&gt;
  &lt;li&gt;出力: 9K × $15.00 / 100万 = $0.135&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;合計: 1タスクあたり$0.1725&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;GPT-5.5はタスクあたりコストがほぼ2倍。SWE-benchの精度ギャップ（88.7% vs 約74%）で再作業が減るなら、全体コストが逆転するケースも。&lt;/p&gt;

&lt;h2 id="初日から組み込むべきコスト管理策"&gt;初日から組み込むべきコスト管理策&lt;/h2&gt;

&lt;p&gt;請求額を抑えるため、以下のコントロールを導入してください：&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;
&lt;strong&gt;&lt;code&gt;max_output_tokens&lt;/code&gt;の厳格な上限&lt;/strong&gt;（全API呼び出しで必須。通常は2,000程度をデフォルトに）&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;厳密なJSONスキーマ指定&lt;/strong&gt;（フォーマットミスによる再試行は全額再課金）&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;難易度ルーティング&lt;/strong&gt;（簡単なリクエストはGPT-5.4-mini、難しいものはGPT-5.5へ。シンプルなルーター設計で大幅節約）&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;オフライン処理は必ずバッチ利用&lt;/strong&gt;（評価・バックフィル・夜間処理等は50%オフ）&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;&lt;code&gt;usage.reasoning_tokens&lt;/code&gt;のモニタリング&lt;/strong&gt;（高労力推論トークンの異常消費にアラート設定）&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id="プランごとの月額費用見積もり"&gt;プランごとの月額費用見積もり&lt;/h2&gt;

&lt;p&gt;ChatGPT経由でGPT-5.5を使う場合の月額コスト例：&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;プラン&lt;/th&gt;
&lt;th&gt;月額料金&lt;/th&gt;
&lt;th&gt;最適ユーザー&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;Free&lt;/td&gt;
&lt;td&gt;$0&lt;/td&gt;
&lt;td&gt;まずCodex経由でお試ししたい方&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Go&lt;/td&gt;
&lt;td&gt;$4 / 月&lt;/td&gt;
&lt;td&gt;学生・ライトユーザー&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Plus&lt;/td&gt;
&lt;td&gt;$20 / 月&lt;/td&gt;
&lt;td&gt;個人開発者の日常利用&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Pro&lt;/td&gt;
&lt;td&gt;$200 / 月&lt;/td&gt;
&lt;td&gt;パワーユーザー、ChatGPTでThinking/Pro機能活用&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Business&lt;/td&gt;
&lt;td&gt;$25 / シート / 月&lt;/td&gt;
&lt;td&gt;チーム用ワークスペース&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Enterprise / Edu&lt;/td&gt;
&lt;td&gt;カスタム&lt;/td&gt;
&lt;td&gt;SLA契約ベース&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;月あたり400万出力トークン以上使う場合、CLIワークロードが40万トークンウィンドウ内に収まるなら、ChatGPT Pro＋Codex CLIの方がAPI従量課金より安価です。&lt;/p&gt;

&lt;h2 id="注目すべき価格変更シグナル"&gt;注目すべき価格変更シグナル&lt;/h2&gt;

&lt;p&gt;長期予算計画なら以下をウォッチ：&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;
&lt;strong&gt;GPT-5.5 APIのGA（一般提供）&lt;/strong&gt;：AnthropicやGemini 3.5、&lt;a href="https://www.vellum.ai/llm-leaderboard" rel="noopener noreferrer"&gt;Vellumリーダーボード&lt;/a&gt;等との競合状況次第で、OpenAIが価格改定する可能性あり。&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;Proモデルの価格民主化&lt;/strong&gt;：過去の傾向として、リリース後3～6ヶ月でPro価格が引き下げられるが、今後もそうなる保証はない。&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id="faq-よくある質問"&gt;FAQ（よくある質問）&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;キャッシングで入力コストは下がる？&lt;/strong&gt;&lt;br&gt;
はい。GPT-5.5でキャッシュされた入力トークンは一部割引料金で請求されます。詳細は&lt;a href="https://openai.com/api/pricing/" rel="noopener noreferrer"&gt;OpenAI料金ページ&lt;/a&gt;参照。再利用可能なプロンプト、ツールスキーマ、リポジトリコンテキスト等はキャッシュ推奨。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;ボリュームディスカウントは？&lt;/strong&gt;&lt;br&gt;
公式には非公開。エンタープライズ契約では個別見積もりあり。年間数百万ドル規模の利用なら営業担当へ。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;思考モードに追加料金はある？&lt;/strong&gt;&lt;br&gt;
追加料金はなし。ただし消費トークンが増えるため合計コストは増加。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Codex CLIの利用課金はAPIと別？&lt;/strong&gt;&lt;br&gt;
APIキーでサインイン時のみ従量請求。ChatGPTサインイン時はプラン料金。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;GPT-5.5を最安で試す方法は？&lt;/strong&gt;&lt;br&gt;
FreeまたはGoプラン＋Codex CLI。全無料オプションは&lt;a href="http://apidog.com/blog/how-to-use-gpt-5-5-api-for-free?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;無料パスガイド&lt;/a&gt;参照。&lt;/p&gt;

</description>
    </item>
  </channel>
</rss>
