KI-Bildgeneratoren sind inzwischen gut genug, um Produktfotos, Profilbilder, Screenshots oder angebliche Ereignisfotos in Sekunden zu erzeugen. Wenn Sie einen Marktplatz, eine Dating-App, eine Nachrichtenplattform, einen Identitätsprüfungs-Workflow oder einen Feed für User Generated Content betreiben, brauchen Sie früher oder später eine programmatische Antwort auf diese Frage: Wurde dieses Bild von einer Maschine erstellt?
KI-Bilderkennungs-APIs liefern darauf keine absolute Wahrheit, sondern ein technisches Signal: Sie senden ein Bild, erhalten einen Score zurück und manchmal zusätzlich eine Einschätzung, welches Modell es erzeugt haben könnte. Genau deshalb sollten Sie solche APIs wie jeden anderen Risikoscore behandeln: testen, kalibrieren, Schwellenwerte setzen und Grenzfälle manuell prüfen.
TL;DR
Für eine Entwickler-API mit offener Registrierung, Generator-Zuordnung und klarer REST-Dokumentation sind Sightengine und Hive Moderation die stärksten allgemeinen Optionen. AI or Not ist eine gute Wahl, wenn Sie einen einfachen synchronen Endpunkt möchten. Reality Defender passt besonders gut, wenn Deepfakes und Gesichtsmanipulation Ihr Hauptproblem sind. OpenAIs DALL-E 3 Klassifikator ist nur für Forschungszwecke zugänglich und keine allgemeine Entwickler-API.
Wichtig: Kein Detektor ist schlüssig. Verwenden Sie die Antwort als Signal, nicht als endgültiges Urteil.
So integrieren Sie eine KI-Bilderkennungs-API sinnvoll
Bevor Sie Anbieter vergleichen, definieren Sie den Workflow. Eine gute technische Integration beginnt nicht mit dem API-Key, sondern mit der Frage, was nach dem Score passieren soll.
Ein praktikabler Ablauf sieht so aus:
- Benutzer lädt ein Bild hoch.
- Ihr Backend speichert das Bild temporär oder reicht es direkt an den Anbieter weiter.
- Die Erkennungs-API gibt einen Score zurück.
- Ihr System entscheidet anhand von Schwellenwerten:
- niedriger Score: akzeptieren
- mittlerer Score: zur manuellen Prüfung
- hoher Score: blockieren oder zusätzliche Prüfung auslösen
- Sie loggen Score, Anbieter, Modellvermutung, Latenz und finale Entscheidung.
- Sie passen Schwellenwerte anhand echter Fälle an.
Beispiel für eine generische Node.js-Integration:
import fs from "node:fs";
async function detectAiImage(imagePath) {
const form = new FormData();
form.append("image", new Blob([fs.readFileSync(imagePath)]));
const response = await fetch("https://anbieter.example/api/detect", {
method: "POST",
headers: {
Authorization: `Bearer ${process.env.AI_IMAGE_DETECTOR_API_KEY}`
},
body: form
});
if (!response.ok) {
throw new Error(`Detection failed: ${response.status}`);
}
return response.json();
}
const result = await detectAiImage("./upload.jpg");
console.log({
score: result.score,
model: result.model,
raw: result
});
Setzen Sie danach keine harte Ja/Nein-Logik ohne Kalibrierung ein. Besser:
function decide(score) {
if (score >= 0.9) return "block_or_escalate";
if (score >= 0.6) return "manual_review";
return "allow";
}
Die konkreten Feldnamen unterscheiden sich je nach Anbieter. Testen Sie deshalb zuerst die tatsächliche JSON-Antwort mit realistischen Bildern.
Bewertungskriterien für eine KI-Bilderkennungs-API
Genauigkeit: Vertrauen Sie nicht nur der Marketingzahl
Jeder Anbieter nennt eine Genauigkeit. Diese Zahl ist nur so gut wie der Testdatensatz dahinter.
Prüfen Sie deshalb:
- Welche Generatoren wurden getestet?
- Wurden Bilder komprimiert, zugeschnitten oder als Screenshot erneut gespeichert?
- Sind neue Modelle wie Flux, aktuelle Stable-Diffusion-Versionen oder neuere Bildmodelle enthalten?
- Wie hoch ist die Falsch-Positiv-Rate bei echten Bildern?
- Gibt es Scores oder nur ein binäres Ergebnis?
Führen Sie immer einen eigenen Test mit Bildern durch, die Ihrem echten Traffic ähneln.
Falsch-positive Ergebnisse sind oft teurer als falsch-negative
Ein falsch-negatives Ergebnis lässt ein synthetisches Bild durch. Ein falsch-positives Ergebnis markiert ein echtes Foto als Fälschung.
Für viele Produkte ist das falsch-positive Ergebnis problematischer, weil es Nutzer fälschlich des Betrugs beschuldigen kann. Deshalb sollten Sie Scores nicht direkt als Urteil verwenden.
Empfohlene Praxis:
0.00 - 0.59 akzeptieren
0.60 - 0.89 manuelle Prüfung
0.90 - 1.00 blockieren oder zusätzliche Verifikation
Diese Werte sind nur Startpunkte. Ihre finalen Schwellenwerte sollten aus eigenen Tests entstehen.
Latenz und Durchsatz
Wenn die Erkennung Teil eines Upload-Flows ist, wartet der Benutzer auf das Ergebnis. Ein synchroner Call mit zwei Sekunden Latenz fühlt sich anders an als einer mit 200 ms.
Messen Sie:
- Latenz aus Ihrer Region
- Latenz bei realer Bildgröße
- Verhalten bei parallelen Uploads
- Rate Limits
- Fehlerverhalten bei Timeouts
Für produktive Systeme empfiehlt sich ein Timeout:
const controller = new AbortController();
const timeout = setTimeout(() => {
controller.abort();
}, 3000);
try {
const response = await fetch(apiUrl, {
method: "POST",
body: form,
signal: controller.signal
});
} finally {
clearTimeout(timeout);
}
Modellabdeckung
„KI-generiert“ ist kein einzelnes Problem. Detektoren werden gegen bestimmte Generatorfamilien trainiert, z. B.:
- Midjourney
- Stable Diffusion
- DALL-E
- Flux
- Firefly
- Imagen
- Seedream
Wenn Sie nicht nur wissen müssen, ob ein Bild synthetisch ist, sondern auch welches Modell es erzeugt haben könnte, achten Sie auf Generator-Scores in der Antwort.
Deepfakes sind ein separater Anwendungsfall
Ein vollständig generiertes Bild ist nicht dasselbe wie ein manipuliertes Gesicht in einem echten Foto. Deepfake-Erkennung ist ein eigenes Spezialgebiet.
Wenn Ihr Risiko Identitätsbetrug, Face Swap oder Gesichts-Reenactment ist, priorisieren Sie Anbieter mit Deepfake-Fokus.
Preismodell
Vergleichen Sie nicht nur den Preis pro Anfrage. Anbieter rechnen unterschiedlich ab:
- pro Bild
- pro Operation
- pro Credit
- pro Monatsstufe
- mit Overage-Kosten
- mit Enterprise-Angebot
Wichtig: Manche erweiterten Prüfungen kosten mehrere Operationen pro Bild.
Datenschutz und Datenresidenz
Sie senden Benutzerbilder an einen Drittanbieter. Prüfen Sie deshalb:
- Werden Bilder gespeichert?
- Wie lange?
- Werden Ihre Daten zum Training verwendet?
- Gibt es regionale Verarbeitung?
- Gibt es On-Premise-Optionen?
- Gibt es DPA/SLA-Unterstützung?
Wenn Sie tiefer in die Grenzen solcher Systeme einsteigen möchten: warum die KI-Bilderkennung fehlschlägt.
Hive Moderation
Hive ist ein etablierter Anbieter für Inhaltsmoderation. Die Erkennung von KI-generierten und Deepfake-Inhalten ist Teil eines breiteren Portfolios für visuelle Moderation, Text und Audio.
Was es erkennt
Hive gibt einen Konfidenzwert zurück, ob ein Bild KI-generiert ist. Zusätzlich kann es den wahrscheinlichen Quellgenerator nennen. Die Produktlinie umfasst Bilder, Videos und Audio sowie separate Deepfake-Erkennung.
Zugriff
Hive bietet einen Self-Service-Entwicklerplan. Der Ablauf:
- Konto erstellen
- Zahlungsmethode hinzufügen
- V3-API-Schlüssel erzeugen
- REST-Endpunkt aufrufen
- Rate Limits und Verbrauch überwachen
Für hohes Volumen wechseln Sie in der Regel auf einen Enterprise-Plan mit benutzerdefinierten Limits und Preisen. Eine On-Premise-Bereitstellung ist für Unternehmenskunden verfügbar.
Aktuelle Zahlen finden Sie auf der Preisseite von Hive.
Vorteile
- Reifes Produkt mit Self-Service-Zugang
- Generator-Zuordnung statt nur Ja/Nein
- Ein Anbieter für Bild, Video, Audio und Moderation
- On-Premise-Option für sensible Bereitstellungen
Nachteile
- Self-Service-Rate-Limits sind begrenzt
- Höhere Stufen sind angebotsbasiert
- Genauigkeit hängt stark von Generator und Bildqualität ab
Sightengine
Sightengine ist eine API-Plattform für Inhaltsmoderation und Bildanalyse. Die KI-Bilderkennung ist besonders entwicklerfreundlich dokumentiert.
Was es erkennt
Sightengine erkennt, ob ein Bild von einem KI-Modell generiert wurde, und liefert Konfidenzwerte pro Generator. Die Dokumentation nennt unter anderem Abdeckung für Stable Diffusion, Midjourney, DALL-E / GPT-Bildausgabe, Flux, Firefly, Googles Bildmodelle und Seedream.
Zusätzlich bietet Sightengine separate Prüfungen für KI-generierte Videos und Deepfakes.
Zugriff
Der Einstieg ist offen:
- Konto erstellen
- API-Zugangsdaten abrufen
- REST-API oder SDK verwenden
- Operationen und Limits überwachen
Sightengine bietet einen kostenlosen Plan für Tests mit monatlichen und täglichen Grenzen. Bezahlte Stufen erhöhen die Limits. Wichtig: Die Abrechnung erfolgt in „Operationen“. Erweiterte Prüfungen wie KI-Bilderkennung können mehrere Operationen pro Aufruf kosten.
Aktuelle Details finden Sie auf der Preisseite von Sightengine.
Vorteile
- Gute REST-Dokumentation
- Offizielle SDKs in Python, PHP und Node.js
- Scores pro Generator
- Kostenlose Stufe ohne Zeitlimit
- KI-Bild-, KI-Video- und Deepfake-Prüfungen beim selben Anbieter
Nachteile
- Operationsbasierte Abrechnung muss sorgfältig kalkuliert werden
- Neue Generatoren werden erst nach Modellupdates besser erkannt
AI or Not
AI or Not ist ein auf Erkennung spezialisiertes Startup. Im Gegensatz zu breiten Moderationsanbietern ist die Erkennung von KI-generierten und manipulierten Medien das Kernprodukt.
Was es erkennt
AI or Not klassifiziert Bilder als KI-generiert oder nicht und liefert generatorspezifische Signale, z. B. für Midjourney oder DALL-E. Zusätzlich gibt es Deepfake-Erkennung sowie weitere Signale wie NSFW- und Bildqualitätsbewertungen.
Wie bei allen Anbietern sollten Sie veröffentlichte Genauigkeitsangaben mit eigenen Daten validieren.
Zugriff
Der Ablauf ist einfach:
- Konto erstellen
- API-Key erzeugen
- Bearer-Token verwenden
- Einzelbild oder Massennutzung testen
AI or Not bietet kostenlose Einzelbildprüfungen auf der Website und eine kostenpflichtige API für Massen- und kommerzielle Nutzung.
Details stehen in der AI or Not API-Dokumentation.
Vorteile
- Einfacher synchroner Endpunkt
- Eine Anfrage liefert einen vollständigen Bericht
- Erkennung ist das Kernprodukt
- Generator-Zuordnung plus Deepfake- und Qualitätssignale
- Offene Registrierung
Nachteile
- Kleineres Unternehmen als etablierte Moderationsanbieter
- Öffentliche Preisdetails sind begrenzter
Reality Defender
Reality Defender ist auf Deepfake-Erkennung spezialisiert und richtet sich historisch stark an Unternehmen und Behörden. Seit 2025 gibt es eine öffentliche Entwickler-API mit kostenloser Stufe.
Was es erkennt
Reality Defender ist besonders stark bei Deepfakes: manipulierte und synthetische Medien, insbesondere im Kontext von Identität und Nachahmung. Das Produkt unterstützt derzeit Bild- und Audioerkennung; Video wird als geplante Ergänzung genannt.
Wenn Ihr Risiko Face Swap, Gesichtsmanipulation oder Identitätsbetrug ist, ist Reality Defender eine naheliegende Option.
Zugriff
Der Einstieg:
- RealAPI-Konto erstellen
- API-Key generieren
- Anfrage mit API-Key authentifizieren
- monatliches Scan-Kontingent überwachen
Die kostenlose Stufe eignet sich für Evaluation, nicht für Produktionsvolumen. Aktuelle Limits stehen auf der API-Seite von Reality Defender.
Vorteile
- Deepfake-Spezialist
- Öffentliche kostenlose Stufe
- SDKs für mehrere Sprachen plus HTTPS
- Multi-Modell-Erkennung statt einzelner Klassifikator
Nachteile
- Fokus liegt stärker auf Deepfakes und Audio als auf generischer KI-Kunst
- Kostenlose Stufe ist klein
OpenAIs DALL-E 3 Erkennungsklassifikator
OpenAI entwickelte einen Klassifikator, der vorhersagt, ob ein Bild von DALL-E 3 stammt. Für Entwickler ist wichtig: Das ist keine allgemein verfügbare API.
Was es erkennt
Der Klassifikator schätzt, ob ein Bild speziell von DALL-E 3 stammt. Er liefert ein True/False-Ergebnis plus kontinuierlichen Score.
Der Anwendungsbereich ist eng:
- DALL-E 3: ja
- Midjourney: nein
- Stable Diffusion: nein
- andere Generatoren: nein
OpenAI berichtete hohe interne Genauigkeit bei DALL-E-3-Bildern und niedrige Falsch-Positiv-Raten, aber diese Zahlen beziehen sich auf OpenAIs eigenes Modell und interne Tests.
Zugriff
Der Zugang erfolgt über OpenAIs Researcher Access Program. Es richtet sich an Forschungslabore und forschungsorientierte gemeinnützige Journalismusorganisationen.
Für Produktentwicklung gilt daher:
Nicht als Produktionsabhängigkeit einplanen.
OpenAI beschrieb den Klassifikator und die breitere Herkunftsarbeit im Beitrag zum Fortschritt der Inhaltsherkunft. Dazu gehören auch C2PA und SynthID-Wasserzeichen.
Warum es trotzdem relevant ist
Die Richtung ist wichtig: Die Branche bewegt sich zunehmend zu Herkunftsmetadaten und Wasserzeichen statt reiner Klassifikation.
Planen Sie langfristig, zusätzlich zu Klassifikator-Scores auch Signale wie diese zu verarbeiten:
Vorteile
- Hohe gemeldete Genauigkeit bei DALL-E-3-Bildern
- Binäres Ergebnis plus kontinuierlicher Score
Nachteile
- Nur Forschungszugang
- Keine offene Entwickler-API
- Nur DALL-E 3
- Nicht für Produktionsfeatures geeignet
Illuminarty
Illuminarty ist ein Erkennungsdienst mit Webtool und Entwickler-API. Es ist eine der erschwinglicheren Optionen mit veröffentlichter Preisstaffel.
Was es erkennt
Illuminarty prüft, ob ein Bild KI-generiert wurde, schätzt den wahrscheinlich verwendeten Generator und bietet lokalisierte Erkennung. Das bedeutet: Es kann Bereiche markieren, die synthetisch wirken.
Das ist besonders nützlich, wenn Sie keine komplett generierten Bilder vermuten, sondern partielle Bearbeitungen.
Zugriff
Der Ablauf:
- Konto erstellen
- Plan auswählen
- API-Zugang verwenden
- tägliche Limits beachten
Illuminarty bietet einen kostenlosen Plan für grundlegende Bild- und Textklassifizierung. Bezahlte Stufen fügen Modellidentifizierung, lokalisierte Erkennung und höhere Limits hinzu.
Prüfen Sie aktuelle Details auf der Illuminarty-Website.
Vorteile
- Veröffentlichte Preisstufen
- Lokalisierte Erkennung synthetischer Bildbereiche
- Kostenloser Plan für grundlegende Klassifizierung
Nachteile
- Kleinerer Anbieter
- Generatorabdeckung sollte mit eigenem Traffic geprüft werden
Hugging Face gehostete Klassifikationsmodelle
Hugging Face ist kein spezialisierter Erkennungsanbieter, sondern ein Modell-Hub. Trotzdem können Sie dort Open-Source-Modelle für KI-Bilderkennung über gehostete Inferenz oder eigene Infrastruktur nutzen.
Was es erkennt
Das hängt vollständig vom Modell ab. Es gibt Community-Modelle, die Bilder als KI-generiert oder menschlich erstellt klassifizieren. Viele basieren auf Architekturen wie SigLIP oder Vision Transformers.
Sie übernehmen dabei aber auch die Verantwortung für:
- Modellauswahl
- Evaluation
- Updates
- Monitoring
- Verfügbarkeit
Zugriff
Mögliche Wege:
- Hugging-Face-Konto erstellen
- Zugriffstoken erzeugen
- Modell auswählen
- Serverlose Inferenz-API nutzen
- Alternativ dedizierten Inferenz-Endpunkt bereitstellen
- Optional Modell selbst hosten
Modelle finden Sie unter huggingface.co.
Vorteile
- Maximale Kontrolle
- Modell kann inspiziert, angepasst oder selbst gehostet werden
- Potenziell niedrige Kosten bei großem Volumen
- Weniger Anbieterbindung
Nachteile
- Keine Anbieter-Garantie für Genauigkeit
- Qualität variiert stark zwischen Community-Modellen
- Viele Modelle hinken neuen Generatoren hinterher
- Mehr Engineering-Aufwand als bei einer fertigen API
Wenn Sie diesen Weg wählen, hilft dieser Leitfaden: wie Sie Ihre eigene KI-Bilderkennungs-API erstellen.
Vergleichstabelle
| Anbieter | Offene Registrierung | Was es erkennt | API-Stil | Generator-Zuordnung | Deepfake-Unterstützung | Kostenlose Stufe | Preismodell |
|---|---|---|---|---|---|---|---|
| Hive Moderation | Ja, Self-Service | KI-Bilder, Video, Audio | REST | Ja, sagt Generator voraus | Ja | Starterguthaben bei Registrierung | Self-Service plus Unternehmensangebot |
| Sightengine | Ja | KI-Bilder, Video, Deepfakes | REST plus SDKs für Python, PHP, Node | Ja, Scores pro Generator | Ja | Ja, ohne Zeitlimit | Monatliche Stufen, Abrechnung in Operationen |
| AI or Not | Ja | KI-Bilder, Audio, Deepfakes | REST, synchroner Endpunkt | Ja, pro Generator | Ja | Kostenlose Einzelbildprüfungen | Kostenpflichtige API für Massen- und kommerzielle Nutzung |
| Reality Defender | Ja, öffentliche API | Deepfakes, KI-Bilder, Audio | REST plus SDKs für Python, TS, Go, Rust, Java | Erkennungsfokussiert | Ja, Kernkompetenz | Ja, kleines monatliches Kontingent | Kostenlose Stufe plus kostenpflichtige Pläne |
| OpenAI DALL-E 3 Klassifikator | Nein, nur Forschungszugang | Nur DALL-E-3-Bilder | REST | Nein, auf DALL-E 3 beschränkt | Nein | Nur Forschungsguthaben | Researcher Access Program |
| Illuminarty | Ja | KI-Bilder, lokalisierte Regionen | REST | Ja, wahrscheinliches Modell | Begrenzt | Ja, grundlegende Klassifizierung | Veröffentlichte monatliche Stufen |
| Hugging Face gehostete Modelle | Ja, HF-Konto | Abhängig vom Modell | REST-Inferenz | Abhängig vom Modell | Abhängig vom Modell | Serverlose kostenlose Nutzung, begrenzt | Pro Nutzung oder dedizierter Endpunkt |
Implementierungs-Checkliste
Bevor Sie eine API produktiv einsetzen:
- [ ] Eigenen Testdatensatz aus echten Upload-Szenarien erstellen
- [ ] Echte Bilder, KI-Bilder und bearbeitete Bilder mischen
- [ ] Ergebnisse pro Anbieter speichern
- [ ] Latenz pro Region messen
- [ ] Falsch-positive Fälle manuell prüfen
- [ ] Schwellenwerte definieren
- [ ] Grenzfälle in eine Review-Queue leiten
- [ ] API-Fehler und Timeouts behandeln
- [ ] Kosten pro Upload-Szenario berechnen
- [ ] Datenschutzbedingungen prüfen
Ein einfaches Logging-Schema kann so aussehen:
{
"image_id": "upload_123",
"provider": "sightengine",
"score": 0.82,
"predicted_generator": "midjourney",
"decision": "manual_review",
"latency_ms": 418,
"created_at": "2026-06-08T12:00:00Z"
}
Fazit
KI-Bilderkennung ist nützlich, aber nicht endgültig. Verwenden Sie sie als Risikosignal in einem größeren System.
- Für allgemeine Entwickler-APIs mit offener Registrierung und Generator-Zuordnung: Sightengine oder Hive Moderation
- Für einen einfachen synchronen Endpunkt: AI or Not
- Für Deepfakes und Gesichtsmanipulation: Reality Defender
- Für Forschung zu DALL-E 3: OpenAIs DALL-E 3 Klassifikator, aber nicht als Produktions-API
- Für lokalisierte Erkennung und Budget-Fokus: Illuminarty
- Für maximale Kontrolle: Hugging Face mit eigenem Engineering-Aufwand
Der zuverlässigste Weg zur Auswahl ist ein eigener Vergleich. Rufen Sie die Endpunkte der Anbieter in Apidog auf, senden Sie echte Bilder, inspizieren Sie das JSON, messen Sie die Latenz aus Ihrer Region und vergleichen Sie die Ergebnisse nebeneinander, bevor Sie Produktionscode schreiben.





Top comments (0)