Akira

Posted on Jun 8 • Originally published at apidog.com

開発者向けAI画像検出APIおすすめ2026年版

AI画像生成ツールは急速に進化しました。実在しない人物の写真、撮影されたことのない製品ショット、起こらなかった出来事の「スクリーンショット」まで、数秒で生成されます。マーケットプレイス、出会い系アプリ、ニュースプラットフォーム、本人確認フロー、ユーザー生成コンテンツフィードを運営しているなら、最終的には「この画像は機械によって作られたものか？」をプログラムで判定する必要があります。

Apidogを今すぐ試す

AI画像検出APIは、この問いに対して確率スコアや生成モデルの推定を返します。ただし、この分野はまだ混沌としています。実際のAPIを持たないWebツールもあれば、営業経由でしか使えないエンタープライズ製品もあります。一方で、オープンサインアップ、明確なRESTドキュメント、開発者向けの無料枠を備えたAPIも存在します。

要約

モデル帰属と明確なRESTドキュメントを重視するなら、一般的な選択肢としては Sightengine と Hive Moderation が有力です。シンプルな同期エンドポイントを使いたい場合は AI or Not も候補になります。

ディープフェイク、特に顔のなりすましが主なリスクなら Reality Defender を優先してください。公開無料枠があります。

OpenAIのDALL-E 3分類器 は研究アクセス向けであり、一般的な開発者APIではありません。

重要なのは、どの検出器も決定的ではないことです。スコアは「最終判断」ではなく「信号」として扱い、しきい値、レビュー導線、監査ログと組み合わせて実装してください。

AI画像検出APIを評価する方法

ベンダー比較の前に、まず自分のプロダクトで何を守りたいのかを定義します。ベンチマーク上は高精度でも、自社トラフィックでは期待通りに動かないことがあります。

精度は自社データで検証する

ベンダーが提示する精度値は、そのテストセットに依存します。

確認すべき点は次の通りです。

どの生成器で学習・評価されているか
Midjourney、Stable Diffusion、DALL-E、Flux、Firefly、Imagenなどをどこまでカバーしているか
リサイズ、再圧縮、スクリーンショット、トリミング後の画像でも性能が出るか
最新モデルに追従しているか
自社の実画像に近い条件で検証できるか

実装前に、少なくとも以下のような評価セットを作ると判断しやすくなります。

dataset/
  real/
    marketplace_photo_001.jpg
    user_profile_001.jpg
  ai_generated/
    midjourney_001.jpg
    dalle_001.jpg
    stable_diffusion_001.jpg
  edited/
    recompressed_001.jpg
    cropped_001.jpg
    screenshot_001.jpg

APIの精度は、この評価セットで比較してください。

誤検出（False Positive）のコストを設計に入れる

AI画像検出では、主に2種類の失敗があります。

False Negative: AI生成画像を見逃す
False Positive: 本物の画像をAI生成と誤判定する

多くのプロダクトでは、False Positiveの方が大きな問題になります。本物のユーザーを不正扱いするためです。

そのため、実装では「即ブロック」ではなく、スコア帯ごとに処理を分けるのが現実的です。

function decideAction(score) {
  if (score >= 0.9) {
    return "reject_or_hold";
  }

  if (score >= 0.6) {
    return "manual_review";
  }

  return "allow";
}

しきい値は固定せず、実トラフィックとレビュー結果を見ながら調整してください。

レイテンシーとスループットを測る

画像検出をアップロードフローに同期的に入れる場合、APIの応答時間はUXに直結します。

確認すべき項目は次の通りです。

自社リージョンからの実測レイテンシー
画像サイズごとの応答時間
同時リクエスト時の挙動
無料枠・有料枠のレート制限
タイムアウト時のフォールバック

同期処理にする場合は、最低限タイムアウトを設定します。

const controller = new AbortController();
const timeout = setTimeout(() => controller.abort(), 3000);

try {
  const response = await fetch(process.env.AI_IMAGE_DETECTOR_ENDPOINT, {
    method: "POST",
    headers: {
      Authorization: `Bearer ${process.env.AI_IMAGE_DETECTOR_API_KEY}`,
    },
    body: formData,
    signal: controller.signal,
  });

  const result = await response.json();
  console.log(result);
} finally {
  clearTimeout(timeout);
}

アップロード体験を止めたくない場合は、非同期ジョブにして後続処理でレビュー・制限をかける設計も検討してください。

モデルカバレッジを確認する

「AI生成」といっても、生成器ごとに特徴は異なります。検出器は特定の生成器ファミリーに対して訓練されています。

確認すべき生成器の例は次の通りです。

Midjourney
Stable Diffusion
DALL-E
Flux
Firefly
Google Imagen
その他の新しい生成モデル

画像がAI生成かどうかだけでなく、どのモデルで作られた可能性が高いかを知りたい場合は、生成器ごとの信頼度スコアを返すAPIを選んでください。

ディープフェイクは別枠で考える

完全に合成された画像の検出と、本物の写真に加工された顔を検出することは別問題です。

本人確認やなりすまし対策が目的なら、一般的なAI画像検出APIよりも、ディープフェイク検出に強いAPIを優先してください。

料金モデルを実リクエスト数で試算する

ベンダーごとに課金単位が異なります。

画像ごと
操作ごと
クレジットごと
月額ティア + 超過料金
エンタープライズ見積もり

注意点は、1回のアップロードで複数チェックが走る場合です。

1アップロード = AI画像検出 + NSFWチェック + 顔検出
月間100,000アップロード
=> 実際の課金対象は300,000操作になる可能性

料金表は、API呼び出し単価ではなく、実際の処理フローに合わせて見積もってください。

データプライバシーとデータレジデンシーを確認する

ユーザー画像を第三者に送信するため、データ処理条件は必ず確認してください。

確認すべき質問は次の通りです。

画像は保存されるのか
保存期間はどれくらいか
学習データに使われるのか
削除リクエストは可能か
オンプレミスまたは地域内デプロイは可能か
規制産業で利用できる条件を満たすか

検出の限界については、AI画像検出が失敗する理由も参考になります。

Hive Moderation

Hive（Hive AI / Hive Moderation）は、コンテンツモデレーション分野で広く使われているベンダーです。AI生成コンテンツやディープフェイクの検出に加えて、ビジュアルモデレーション、テキスト、オーディオ製品も提供しています。

検出するもの

HiveのAI生成コンテンツ分類器は、画像がAI生成かどうかの信頼度スコアを返します。また、どの生成エンジンで作られた可能性があるかも返します。

製品ラインナップは、画像、ビデオ、オーディオをカバーし、ディープフェイク検出も含まれます。

アクセス方法

Hiveはセルフサービス開発者プランを提供しています。サインアップ後、支払い方法を追加すると、テスト用の無料スタータークレジットを利用できます。

セルフサービスV3 APIはすぐに利用でき、V3 APIキーを作成して呼び出せます。大容量トラフィックでは、カスタムレート制限と価格設定のためにエンタープライズプランへ移行します。オンプレミスデプロイメントもエンタープライズ顧客向けに提供されています。

現在の料金は、Hiveの料金ページで確認してください。

長所

成熟したプロダクトで、セルフサービスティアがある
バイナリ判定だけでなく、生成元の推定も返す
画像、ビデオ、オーディオ、モデレーションを1ベンダーで扱える
オンプレミスオプションがある

短所

デフォルトのセルフサービスレート制限は控えめ
大規模利用ではエンタープライズ相談が必要
上位ティアの総コストは事前に見えにくい
精度は生成器と画像品質に依存する

Sightengine

Sightengineは、コンテンツモデレーションと画像解析のAPI企業です。AI生成画像検出についても開発者向けドキュメントが整っており、実装しやすい選択肢です。

検出するもの

Sightengineは、画像がAIモデルによって生成されたかどうかを判定し、生成器ごとの信頼度スコアを返します。

ドキュメントでは、Stable Diffusion、Midjourney、DALL-E / GPT画像出力、Flux、Firefly、Googleの画像モデル、Seedreamなどのカバー範囲が説明されています。

AI生成ビデオ検出とディープフェイク検出も、個別のチェックとして提供されています。

アクセス方法

オープンサインアップに対応しています。Sightengineには、評価目的で期間制限なく使える無料プランがあります。ただし、月間・日間の操作回数には上限があります。

有料ティアでは制限が引き上げられ、超過料金も設定されています。注意点は、使用量が「操作」として計測されることです。AI生成画像検出のような高度なチェックは、標準的なモデレーションよりも1呼び出しあたりの操作コストが高くなる場合があります。

現在の料金と操作コストは、Sightengineの料金ページで確認してください。

長所

開発者向けドキュメントが整っている
Python、PHP、Nodeの公式SDKがある
生成器ごとのスコアを返す
時間制限なしの無料枠がある
AI画像、AIビデオ、ディープフェイクを同じベンダーで扱える

短所

「操作」単位の課金を実コストに換算する必要がある
高度な検出は1操作とは限らない
新しい生成器への追従には再トレーニングが必要

AI or Not

AI or Notは、AI生成メディアや操作されたメディアの検出に特化したスタートアップです。広範なモデレーション製品の一部ではなく、検出そのものが中心機能です。

検出するもの

AI or Notは、画像がAI生成かどうかを分類し、MidjourneyやDALL-Eなどの生成器固有の信号も返します。

ディープフェイク検出、NSFW、画像品質信号なども含まれます。同社は精度数値を公開していますが、他の検出器と同様に、自社データで検証してください。

アクセス方法

オープンサインアップに対応しています。アカウントを作成し、APIキーを取得して、BearerトークンでAPIを呼び出します。

Webサイト上では無料の単一画像チェックを提供しており、一括利用や商用利用向けの有料APIもあります。

現在のプランと制限は、AI or Not APIドキュメントで確認してください。

長所

同期エンドポイントがシンプル
1リクエストでレポートを取得できる
検出が主要製品
生成器帰属、ディープフェイク、品質信号をまとめて返す
評価用の無料導線がある

短所

既存の大手モデレーションベンダーより小規模
長期的な依存関係は慎重に評価する必要がある
公開されている料金情報は限定的

Reality Defender

Reality Defenderは、企業や政府向けにディープフェイク検出を提供してきた企業です。2025年に公開開発者APIと無料枠を開放し、2026年には個人開発者もアクセスできるようになりました。

検出するもの

Reality Defenderの強みはディープフェイク検出です。顔の操作、なりすまし、合成メディアの検出に重点があります。

現在は画像とオーディオの検出をサポートしており、ビデオも追加予定として示されています。一般的なAIアート検出よりも、本人確認や顔操作のリスクが大きい場合に向いています。

アクセス方法

無料枠付きの公開APIです。Reality DefenderプラットフォームでRealAPIアカウントを作成し、APIキーを生成してリクエストを認証します。

無料枠では、評価用に少量の月間スキャンが提供されます。有料プランでは制限が引き上げられます。

現在のティアは、Reality DefenderのAPIページで確認してください。

長所

ディープフェイク検出に特化
企業実績がある
公開無料枠があり、営業商談なしで評価できる
Python、TypeScript、Go、Rust、Java、直接HTTPSに対応
マルチモデル検出を採用

短所

一般的なAIアート検出では、より広範なベンダーの方が生成器カバレッジが広い可能性がある
無料枠は評価向けで、本番トラフィックには少ない

OpenAIのDALL-E 3検出分類器

OpenAIは、画像が自社のDALL-E 3モデルから生成されたものかどうかを予測する分類器を構築しています。ただし、これは一般開発者がすぐに使える汎用APIではありません。

検出するもの

DALL-E検出分類器は、画像がDALL-E 3で生成された可能性を推定する二値分類器です。真偽の結果と連続スコアを返します。

対象はDALL-E 3に限定されます。Midjourney、Stable Diffusion、その他の生成器は対象外です。

OpenAIは、DALL-E 3画像に対する高い内部精度と低い誤検出率を報告していますが、これはOpenAI自身のモデルに関する内部数値です。

アクセス方法

アクセスはOpenAIの研究者アクセスプログラムに制限されています。研究機関や研究志向のジャーナリズム非営利団体が、分類器を評価するためにAPIクレジットを申請する形式です。

オープンサインアップの開発者APIではないため、これを前提に本番機能を設計すべきではありません。

OpenAIは、2026年5月のコンテンツ来歴の推進に関する投稿で、C2PA運営委員会への参加や画像出力へのSynthID透かしの追加について説明しています。

それでも重要な理由

OpenAIの方向性は、業界が「検出単独」から「来歴メタデータ + 透かし技術」へ向かっていることを示しています。

長期的に設計するなら、分類器の確率スコアだけでなく、C2PAコンテンツクレデンシャルやSynthIDのような信号も読み取れるようにしておくべきです。

長所

DALL-E 3画像に対して高精度が報告されている
二値判定と連続スコアを返す

短所

研究アクセスのみ
オープンサインアップがない
DALL-E 3に限定される
本番機能の前提にはできない

Illuminarty

Illuminartyは、消費者向けWebツールと開発者向けAPIの両方を提供する検出サービスです。公開料金体系を持つ、比較的手頃な選択肢です。

検出するもの

Illuminartyは、画像がAI生成かどうかを確認し、どの生成器が使われた可能性が高いかを推定します。

また、局所検出を提供し、画像のどの領域が合成に見えるかを示します。画像全体ではなく、一部編集が疑われる場合に有用です。

アクセス方法

オープンサインアップに対応しています。基本的な画像・テキスト分類向けの無料プランと、モデル識別、局所検出、高い日次リクエスト制限を追加する有料月額ティアがあります。

プランは変更される可能性があるため、契約前にIlluminartyサイトで現在のティアと制限を確認してください。

長所

公開された予測しやすい料金体系
局所検出で合成が疑われる領域を確認できる
基本分類向けの無料プランがある

短所

大手モデレーションベンダーより小規模
SLAや長期サポートは事前に確認が必要
生成器カバレッジは自社トラフィックで検証すべき

Hugging Face ホスト型分類器モデル

Hugging Faceは検出企業ではなくモデルハブです。ただし、ホスト型推論でオープンソースのAI画像検出モデルを実行できるため、コントロールや低コストを重視するチームには現実的な選択肢になります。

検出するもの

検出内容は、選択するモデルに完全に依存します。

Hugging Face Hubには、SigLIPやVision Transformersなどのアーキテクチャを使い、画像をAI生成または人間作成として分類するコミュニティモデルがあります。

ただし、各モデルには独自の訓練データ、生成器カバレッジ、精度プロファイルがあります。単一ベンダーによる保証はありません。

アクセス方法

Hugging Faceアカウントとアクセストークンを作成します。

軽い利用ではサーバーレス推論APIを呼び出せます。安定した本番トラフィックには、専用の推論エンドポイントをデプロイできます。モデル重みをダウンロードして自己ホストすることも可能です。

モデルはhuggingface.coで検索できます。

長所

モデルを選択、検査、微調整、自己ホストできる
大規模利用では低コストになる可能性がある
ベンダーロックインが少ない
オープンモデルを使える

短所

ベンダーによる精度保証やサポートはない
モデル選択、評価、更新、稼働率管理は自社責任
コミュニティモデルは最新生成器に追従していない場合がある
ターンキーAPIよりエンジニアリング作業が多い

この方式を選ぶ場合は、独自のAI画像検出器APIを構築するで、モデルをAPIサービスとしてラップする方法を確認できます。

実装時の基本パターン

どのベンダーを選ぶ場合でも、基本的な実装フローは同じです。

1. ユーザーが画像をアップロード
2. 画像を一時保存
3. AI画像検出APIへ送信
4. スコアとメタデータを保存
5. しきい値に応じて allow / review / reject を決定
6. 境界線のケースは人間レビューへ送る

レスポンスは、後からしきい値を再評価できるように保存しておくと便利です。

{
  "image_id": "img_123",
  "provider": "example_detector",
  "ai_score": 0.82,
  "model_scores": {
    "midjourney": 0.64,
    "stable_diffusion": 0.21,
    "dalle": 0.12
  },
  "decision": "manual_review",
  "created_at": "2026-06-08T10:00:00Z"
}

最初から自動拒否に寄せるのではなく、レビュー結果を蓄積してしきい値を調整するのが安全です。

比較表

プロバイダー	オープンサインアップ	検出するもの	APIスタイル	生成元帰属	ディープフェイクサポート	無料枠	料金モデル
Hive Moderation	はい、セルフサービス	AI画像、ビデオ、オーディオ	REST	はい、生成元を予測	はい	サインアップ時にスタータークレジット	セルフサービスとエンタープライズ見積もり
Sightengine	はい	AI画像、ビデオ、ディープフェイク	RESTとSDK（Python、PHP、Node）	はい、生成器ごとのスコア	はい	はい、期間制限なし	月額ティア、操作数で課金
AI or Not	はい	AI画像、オーディオ、ディープフェイク	REST、同期エンドポイント	はい、生成器ごと	はい	無料の単一画像チェック	一括および商用利用向け有料API
Reality Defender	はい、公開API	ディープフェイク、AI画像、オーディオ	RESTとSDK（Python、TS、Go、Rust、Java）	検出に特化	はい、中核機能	はい、少量の月間割り当て	無料枠と有料プラン
OpenAI DALL-E 3分類器	いいえ、研究アクセスのみ	DALL-E 3画像のみ	REST	いいえ、DALL-E 3に限定	いいえ	研究クレジットのみ	研究者アクセスプログラム
Illuminarty	はい	AI画像、局所領域	REST	はい、可能性のあるモデル	限定的	はい、基本分類	公開されている月額ティア
Hugging Face ホスト型モデル	はい（HFアカウント）	選択したモデルによる	REST推論	モデルによる	モデルによる	サーバーレスの無料利用、制限あり	利用ごとまたは専用エンドポイント

ここにあるすべてのオプションの精度は条件付きとして扱ってください。いずれも決定的な認証器ではありません。

結論

AI画像検出は有用ですが、魔法ではありません。最終判断ではなく、リスク判定システムの1つの信号として使ってください。

オープンサインアップと生成元帰属を重視するなら、Sightengine または Hive Moderation から始める
1回の呼び出しで完結する同期エンドポイントが必要なら、AI or Not を試す
ディープフェイクや顔の操作が主なリスクなら、Reality Defender を優先する
OpenAIのDALL-E 3分類器 は研究アクセスのみなので、本番機能の前提にしない
局所検出と低コストを重視するなら Illuminarty を検討する
自社でモデル運用できるなら、Hugging Face のホスト型モデルまたは自己ホストも選択肢になる
どのAPIも決定的ではないため、自社トラフィックで検証し、境界線のスコアは人間レビューへ回す

最も信頼できる選び方は、実際にテストすることです。各プロバイダーのエンドポイントをApidogに取り込み、実画像を送信し、JSONレスポンスを確認し、自社リージョンからのレイテンシーを測定してから本番実装に進めてください。