Akira

Posted on Apr 24 • Originally published at apidog.com

DeepSeek V4 API 無料使い方

DeepSeek V4は2026年4月23日にリリースされ、そのAPI価格は、ほとんどのチームが無料枠探しを完全にスキップするほど低く設定されています。しかし、クレジットカード情報を登録する前にプログラムでV4を呼び出したい開発者向けには、真の無料パスが存在します。アグリゲーターゲートウェイは:freeバリアントを公開しており、Hugging Faceは共有推論エンドポイントを提供し、公式APIは新規アカウントにトライアルクレジットを付与します。これら3つを組み合わせてApidogでフォールバックチェーンを構築すれば、一切費用をかけずにV4搭載製品のプロトタイプを作成できます。

Apidogを今すぐ試す

このガイドはAPIに特化した無料パスです。ウェブチャットやセルフホスティングを含むより広範なガイドについては、DeepSeek V4を無料で利用する方法をご覧ください。有料のウォークスルーについては、DeepSeek V4 APIの利用方法をご覧ください。製品概要については、DeepSeek V4とは何かをご覧ください。

TL;DR

OpenRouter無料枠 — deepseek/deepseek-v4-flash:free、場合によってはdeepseek-v4-pro:free。OpenAI互換で、キーあたり1日数百リクエスト。
Hugging Face推論プロバイダー — https://router.huggingface.co/hf-inferenceで無料の共有エンドポイント。レート制限あり、プロトタイピングに便利。
Chutes無料枠 — リリースから1週間以内にDeepSeekの無料エンドポイントを頻繁に公開するコミュニティGPUネットワーク。
DeepSeekトライアルクレジット — platform.deepseek.comの新規アカウントには、少額の初期残高が付与されることがあります。
ご自身のGPUでセルフホストされたV4-Flashもライセンスレベルでは無料です。DeepSeek V4をローカルで実行する方法をご覧ください。
プロバイダー間でリクエストの形式を同一に保つため、Apidogでフォールバックチェーンを構築します。

なぜ無料APIパスが存在するのか

DeepSeekの有料料金は、フロンティア層の中でも既に最も低い水準にあります。では、なぜ無料を探す必要があるのでしょうか？理由は3つあります。

カード登録前のプロトタイピング。 調達上の理由、または迅速な概念実証のために、支払い方法を登録する前にコードからV4を呼び出したい場合。
学生、研究、オープンソースでの利用。 予算を組めない小規模なプロジェクトでも、真のフロンティアレベルの品質を求めている場合。
プロバイダーの比較。 3つの異なる無料エンドポイントでV4に対して同じプロンプトを実行することで、本番トラフィックでしか現れないレイテンシー、品質、信頼性の違いが明らかになります。

これらのいずれかに当てはまるなら、このガイドはあなた向けです。出荷可能な製品を構築している場合は、有料APIガイドに進んでください。公式DeepSeek APIの最低2ドルのチャージは、レート制限と格闘するよりも良い選択肢です。

パス1: OpenRouter無料枠

OpenRouterは、OpenAI互換APIの背後でフロンティアモデルを集約するリクエストレベルのゲートウェイです。このプラットフォームは、DeepSeekのリリースと同時に無料バリアントを確実に提供してきました。V3、V3.1、V3.2、そして今回のV4でもこのパターンが維持されています。

セットアップ

openrouter.ai でサインアップします。
Settings → KeysからAPIキーを作成します。
モデルカタログで:freeという接尾辞が付いたエントリ（通常はdeepseek/deepseek-v4-flash:free）を確認します。
OpenAI互換SDKを使用してエンドポイントを呼び出します。

from openai import OpenAI

client = OpenAI(
    api_key=OPENROUTER_API_KEY,
    base_url="https://openrouter.ai/api/v1",
)

response = client.chat.completions.create(
    model="deepseek/deepseek-v4-flash:free",
    messages=[{"role": "user", "content": "Refactor this Go function to use channels."}],
)

print(response.choices[0].message.content)

制限の概要

OpenRouterの無料枠リクエストは、負荷がかかると有料トラフィックの後ろにキューイングされます。一般的な制限は、キーあたり1日50〜200リクエスト程度で、同時実行数も厳しく制限されています。このバリアントは予告なくスロットリングされたり、消滅したりする可能性があります。これはプロトタイピングツールであり、本番環境のバックエンドではありません。

Node版

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.OPENROUTER_API_KEY,
  baseURL: "https://openrouter.ai/api/v1",
});

const response = await client.chat.completions.create({
  model: "deepseek/deepseek-v4-flash:free",
  messages: [{ role: "user", content: "Explain MoE routing like I'm 12." }],
});

console.log(response.choices[0].message.content);

パス2: Hugging Face推論プロバイダー

Hugging Faceは、リリース後まもなくV4チェックポイントを公開する共有推論エンドポイントを運用しています。ログインしたHFトークンがあれば無料で呼び出せますが、レート制限は無料パスの中で最も厳しくなっています。

import os
from huggingface_hub import InferenceClient

client = InferenceClient(
    model="deepseek-ai/DeepSeek-V4-Flash",
    token=os.environ["HF_TOKEN"],
)

response = client.chat_completion(
    messages=[
        {"role": "user", "content": "Write a Python decorator that retries with jitter."}
    ],
    max_tokens=512,
)

print(response.choices[0].message.content)

HFトークンはhttps://huggingface.co/settings/tokensで無料で取得できます。レイテンシーは負荷によって変動し、トークンはアカウントごとの共有日次予算にカウントされます。DeepSeekの有料APIを使用せずに制限を緩和するには、HF Proにアップグレードしてください。

パス3: Chutesとコミュニティゲートウェイ

Chutesは、DeepSeekモデルを無料またはほぼ無料でホストすることが多い分散型GPUネットワークです。https://llm.chutes.ai/v1でOpenAI互換のエンドポイントを公開しています。

client = OpenAI(
    api_key=CHUTES_API_KEY,
    base_url="https://llm.chutes.ai/v1",
)

response = client.chat.completions.create(
    model="deepseek-ai/DeepSeek-V4-Flash",
    messages=[{"role": "user", "content": "Compare CSA and HCA attention in two sentences."}],
)

利用可能性は急速に変化します。依存関係を構築する前に、必ずプロバイダーのダッシュボードで現在のモデルIDとコストを確認してください。

パス4: DeepSeekトライアルクレジット

DeepSeekはこれまで、新規アカウントに少額のトライアルクレジットを付与してきました。金額と期間は変動し、メール認証後に1ドルが残高に加算されることもあります。サインアップ後には、必ずplatform.deepseek.comの請求ダッシュボードを確認してください。

V4の料金体系では、たとえ1ドルのトライアルでも十分に利用できます。1ドルでV4-Flashでは約700万入力トークン、V4-Proでは約57万入力トークンをカバーできます。これは、本番レベルのプロトタイプ呼び出しを数百回行うのに十分な量です。

Apidogでプロバイダーに依存しない無料チェーンを構築する

複数の無料パスを使い分けることで、いずれかのプロバイダーがスロットリングされた場合にも自動的に切り替えられる堅牢なプロトタイプを構築できます。以下の手順でApidogを活用しましょう。

Apidogをダウンロードし、新しいプロジェクトを作成します。
openrouter, huggingface, chutes, deepseek-trialの4つの環境を作成します。
各環境で対応するAPIキーをシークレット変数として保存し、BASE_URLを設定します。
{{BASE_URL}}/chat/completions へのPOSTリクエストを、パラメータ化された model フィールドと共に保存します。
環境切り替え機能を活用して、ワンクリックで同じプロンプトを全プロバイダーで再実行します。

同じアプローチは、対応するGPT-5.5 APIの無料パスにも応用可能です。コレクションをコピーしてプロバイダーを入れ替えるだけです。

コードでフォールバックチェーンを実装する

無料プロバイダーがスロットリングされた場合、自動的に他のプロバイダーへフォールバックする仕組みをコードで実装できます。OpenAI SDK利用例:

import os
from openai import OpenAI, RateLimitError, APIError

PROVIDERS = [
    {
        "base_url": "https://openrouter.ai/api/v1",
        "api_key": os.environ["OPENROUTER_API_KEY"],
        "model": "deepseek/deepseek-v4-flash:free",
    },
    {
        "base_url": "https://llm.chutes.ai/v1",
        "api_key": os.environ["CHUTES_API_KEY"],
        "model": "deepseek-ai/DeepSeek-V4-Flash",
    },
    {
        "base_url": "https://api.deepseek.com/v1",
        "api_key": os.environ["DEEPSEEK_API_KEY"],
        "model": "deepseek-v4-flash",
    },
]

def call_v4(messages):
    for provider in PROVIDERS:
        try:
            client = OpenAI(
                api_key=provider["api_key"],
                base_url=provider["base_url"],
            )
            return client.chat.completions.create(
                model=provider["model"],
                messages=messages,
            )
        except (RateLimitError, APIError) as e:
            print(f"{provider['base_url']} failed: {e}")
            continue
    raise RuntimeError("all providers exhausted")

各無料パスが実際に適している用途

パス	最適な用途	最悪な用途
OpenRouter無料	プロトタイピング、日常開発	厳格なSLAを持つあらゆる用途
HF推論	探索的呼び出し、ノートブック	低レイテンシーワークロード
Chutes	実験的なコミュニティ作業	長期的な依存関係
DeepSeekトライアル	完全な忠実度でのテスト	持続的な本番稼働
セルフホスト型V4-Flash	コンプライアンスが重視される作業	GPU容量のないチーム

重要なクォータ計算

いずれかの無料パスを利用する前に、日次スループットについて簡単な現実確認をしましょう。

OpenRouter無料: キーあたり1日約100リクエスト、各約5万トークン。1日あたり30〜50回の実際の開発呼び出しに役立つ可能性があります。
HF推論無料: 共有レート制限、アカウント全体で1日約1000リクエスト。負荷時には遅くなることもあります。
Chutes: 変動あり。ベストエフォートとして扱ってください。
DeepSeekトライアル (1ドル): V4-Flashで、1回あたり1万入力トークンで約700回の呼び出しが可能。有限ですが、十分な量です。
セルフホスト型V4-Flash: ハードウェアによってスループットが制限されます。H100が4枚搭載されたマシンでは、50〜150トークン/秒を維持できます。

より多くの機能やスループットが必要な場合、有料APIの方が手間なく安価になるケースが多いです。V4-Flashで100万トークンあたり0.14ドルという料金では、2Kコンテキストと500出力トークンを持つ1万回の呼び出しで約2.80ドルかかります。

有料APIに移行するタイミング

以下の3つの兆候があれば、無料枠では足りなくなったと言えます。

レート制限が1日に複数回発生する。
1つのワークロードをカバーするためだけに、複数の無料プロバイダーを連鎖させている。
テストに予測可能なレイテンシーやSLAが必要である。

platform.deepseek.comでの最低チャージ額は2ドルです。無料枠での集中的なプロトタイピングは、有料APIが課金するよりも多くの開発時間を要することがよくあります。DeepSeek V4料金ガイドで全料金表をご確認ください。

FAQ

これらのパスは永続的に無料ですか？

いいえ。無料枠は予告なく変更されることがあります。これらはプロトタイピングツールとして扱い、本番環境のバックエンドとして使用しないでください。
OpenRouterの:freeは本物のV4を実行しますか？

はい、ただし厳格なレート制限のある共有インフラ上で動作します。品質は一致しますが、スループットはそうではありません。
無料パスの出力を製品に使用できますか？

各プロバイダーの規約を確認してください。OpenRouterはレート制限内で商用利用を許可しています。HF Inferenceは商用利用を許可していますが、厳しく制限されています。DeepSeek自身のトライアルクレジットは主要な規約に従います。
どの無料パスが最高のレイテンシーを提供しますか？

DeepSeek自身のトライアルクレジットです。本番環境のインフラを利用するためです。OpenRouterが次に続きます。HF InferenceとChutesは変動します。
V4を無料でセルフホストできますか？

ライセンスレベルではMITライセンスなので可能です。ハードウェアがコストとなります。DeepSeek V4をローカルで実行する方法でセットアップをご覧ください。
今日どの無料パスを使い切ったか追跡するにはどうすればよいですか？

Apidogを使用し、レスポンスビューアでusageをピン留めしてください。ほとんどのアグリゲーターは、管理コンソールで利用状況ダッシュボードも公開しています。

DEV Community