Les générateurs d’images IA progressent vite. Une photo de profil d’une personne inexistante, une image produit jamais photographiée, une fausse « capture » d’événement : tout peut être généré en quelques secondes et publié avant vérification. Si vous gérez une marketplace, une app de rencontres, une plateforme d’actualités, un workflow KYC ou un flux UGC, vous devez pouvoir répondre automatiquement à une question : cette image a-t-elle été créée par une machine ?
Les API de détection d’images IA répondent à ce besoin : vous envoyez une image, vous recevez un score de probabilité, parfois avec une estimation du modèle générateur. Mais l’écosystème est inégal. Certains outils sont de simples démos web sans API exploitable. D’autres nécessitent un cycle commercial enterprise. Quelques fournisseurs proposent une vraie expérience développeur : inscription ouverte, API REST, documentation claire et réponses JSON exploitables.
En bref
Pour une API développeur avec inscription ouverte, attribution de modèle et documentation REST claire, commencez par Sightengine ou Hive Moderation. AI or Not est une bonne option si vous voulez un endpoint synchrone simple. Reality Defender est à privilégier si votre risque principal concerne les deepfakes et la manipulation de visages. Le classificateur DALL-E 3 d’OpenAI reste orienté recherche, pas intégration produit. Aucun détecteur n’est une preuve absolue : utilisez chaque score comme un signal, pas comme un verdict.
Comment évaluer une API de détection d’images IA
Avant de choisir un fournisseur, définissez votre cas d’usage :
- Bloquer automatiquement certains contenus ?
- Déclencher une revue humaine ?
- Étiqueter du contenu comme potentiellement synthétique ?
- Détecter les deepfakes dans un flux d’identité ?
- Mesurer un risque dans un pipeline de modération ?
Votre seuil, votre latence acceptable et votre tolérance aux faux positifs dépendront de cette réponse.
1. Évaluez la précision sur vos propres images
Chaque fournisseur annonce des chiffres de précision. Ne les utilisez pas seuls pour décider.
La précision dépend fortement :
- des générateurs inclus dans le jeu de test ;
- de la compression JPEG ;
- du redimensionnement ;
- du recadrage ;
- des captures d’écran ;
- de l’âge des modèles génératifs testés ;
- du type d’image : portrait, produit, illustration, document, capture d’écran.
Construisez plutôt un petit jeu de validation interne :
dataset/
human/
real-profile-001.jpg
real-product-001.jpg
ai/
midjourney-001.jpg
stable-diffusion-001.jpg
dalle-001.jpg
edited/
cropped-ai-001.jpg
recompressed-ai-001.jpg
screenshot-ai-001.jpg
Puis appelez chaque API avec les mêmes images et comparez :
- score moyen sur les images IA ;
- score moyen sur les images réelles ;
- faux positifs ;
- faux négatifs ;
- comportement sur images compressées ou recadrées.
2. Définissez le coût d’un faux positif
Deux erreurs sont possibles :
- Faux négatif : une image synthétique passe.
- Faux positif : une vraie photo est signalée comme fausse.
Dans beaucoup de produits, le faux positif est plus coûteux : il peut accuser un utilisateur légitime de fraude.
Évitez donc une logique binaire trop agressive :
if (score > 0.95) {
action = "block";
} else {
action = "allow";
}
Préférez une logique par zones :
function decideAiImageAction(score) {
if (score >= 0.95) {
return "block_or_hold";
}
if (score >= 0.70) {
return "manual_review";
}
return "allow";
}
Cette approche réduit les décisions automatiques sur les cas ambigus.
3. Mesurez la latence réelle
Si la détection est appelée pendant un upload, elle se trouve entre l’utilisateur et l’écran de succès.
À tester :
- temps de réponse moyen ;
- p95 et p99 ;
- comportement avec des images lourdes ;
- latence depuis votre région cloud ;
- timeouts ;
- limites de débit ;
- retries nécessaires.
Exemple de test simple avec curl :
time curl -X POST "https://api.example.com/detect" \
-H "Authorization: Bearer $API_KEY" \
-F "image=@sample.jpg"
Répétez sur plusieurs tailles d’image : 200 KB, 1 MB, 5 MB.
4. Vérifiez la couverture des générateurs
« Généré par IA » n’est pas une catégorie unique. Les détecteurs peuvent être meilleurs sur certains générateurs que sur d’autres :
- Midjourney ;
- Stable Diffusion ;
- DALL-E ;
- Flux ;
- Firefly ;
- Imagen ;
- modèles récents ou propriétaires.
Si vous avez besoin d’attribution, cherchez une réponse structurée par générateur, par exemple :
{
"ai_generated": {
"score": 0.91
},
"models": {
"midjourney": 0.73,
"stable_diffusion": 0.12,
"dalle": 0.08
}
}
Cette granularité aide à ajuster vos règles au lieu de dépendre d’un simple true/false.
5. Séparez détection IA et détection deepfake
Détecter une image entièrement synthétique n’est pas la même chose que détecter un visage manipulé dans une vraie photo.
Cas distincts :
- image générée de zéro ;
- visage échangé ;
- visage réanimé ;
- document ou selfie manipulé ;
- vidéo deepfake ;
- audio synthétique.
Si votre risque concerne la vérification d’identité, privilégiez un fournisseur spécialisé deepfake plutôt qu’un détecteur généraliste d’images IA.
6. Calculez le coût réel
Les fournisseurs ne facturent pas tous de la même manière :
- par image ;
- par requête ;
- par crédit ;
- par opération ;
- par niveau mensuel ;
- avec dépassements ;
- avec devis enterprise.
Attention aux modèles où une vérification avancée coûte plusieurs opérations. Votre coût réel peut être :
coût mensuel = uploads mensuels × opérations par upload × prix par opération
Si chaque upload déclenche trois contrôles, le coût par utilisateur peut augmenter vite.
7. Vérifiez confidentialité et rétention
Vous envoyez des images utilisateur à un tiers. Avant production, vérifiez :
- durée de conservation des images ;
- utilisation éventuelle pour l’entraînement ;
- options de suppression ;
- résidence des données ;
- disponibilité d’un déploiement sur site ;
- DPA / conformité ;
- politique de logs.
Pour une analyse plus détaillée des limites techniques, consultez aussi pourquoi la détection d’images IA échoue.
Hive Moderation
Hive — aussi appelé Hive AI ou Hive Moderation — est un fournisseur établi de modération de contenu. Sa détection de contenu généré par IA et de deepfakes s’ajoute à ses produits de modération visuelle, textuelle et audio.
Ce qu’il détecte
Le classificateur de Hive renvoie un score de confiance indiquant si une image est générée par IA. Il peut aussi retourner le moteur génératif probable. La plateforme couvre les images, la vidéo et l’audio, avec une détection deepfake séparée.
Comment l’intégrer
Hive propose une API V3 en libre-service :
- Créez un compte développeur.
- Ajoutez un mode de paiement si nécessaire.
- Générez une clé API V3.
- Envoyez vos images à l’endpoint REST.
- Lisez les scores dans la réponse JSON.
- Appliquez vos propres seuils.
Pour un trafic plus élevé, il faut généralement passer par un plan enterprise avec limites et tarification personnalisées. Consultez la page de tarification de Hive pour les chiffres actuels.
Avantages
- Produit mature et largement déployé.
- Niveau développeur en libre-service.
- Attribution probable du générateur.
- Couverture images, vidéo, audio et modération générale.
- Option sur site pour les clients enterprise.
Inconvénients
- Limites de débit modestes en libre-service.
- Tarification des niveaux supérieurs sur devis.
- Précision variable selon le générateur et la qualité d’image.
Sightengine
Sightengine est une API de modération de contenu et d’analyse d’images. Sa détection d’images générées par IA est l’une des expériences développeur les plus directes de cette liste.
Ce qu’il détecte
Sightengine détermine si une image a été générée par IA et fournit des scores de confiance par générateur. Sa documentation mentionne notamment Stable Diffusion, Midjourney, DALL-E / sortie d’image GPT, Flux, Firefly, des modèles Google et Seedream. Il propose aussi des vérifications séparées pour vidéos IA et deepfakes.
Comment l’intégrer
Le parcours est simple :
- Créez un compte Sightengine.
- Récupérez vos identifiants API.
- Appelez l’endpoint REST ou utilisez un SDK.
- Passez l’image par URL ou upload.
- Analysez les scores retournés.
- Définissez vos seuils internes.
Exemple de logique côté application :
function classifyImage(result) {
const score = result.type?.ai_generated || 0;
if (score > 0.95) return "high_risk";
if (score > 0.70) return "review";
return "low_risk";
}
Sightengine mesure l’usage en opérations. Les vérifications avancées comme la détection d’images IA peuvent coûter plusieurs opérations par appel. Vérifiez les chiffres actuels sur la page de tarification de Sightengine.
Avantages
- Documentation claire pour développeurs.
- SDK officiels en Python, PHP et Node.
- Scores par générateur.
- Niveau gratuit sans limite de temps.
- Même fournisseur pour images IA, vidéos IA et deepfakes.
Inconvénients
- Le modèle de facturation en opérations demande un calcul.
- Les nouveaux générateurs peuvent ne pas être couverts immédiatement.
AI or Not
AI or Not est une startup spécialisée dans la détection de médias générés ou manipulés par IA. Contrairement aux plateformes de modération plus larges, c’est son produit principal.
Ce qu’il détecte
AI or Not classe les images comme générées par IA ou non, avec des signaux par générateur, par exemple Midjourney ou DALL-E. Il inclut aussi des facettes deepfake, NSFW et qualité d’image.
Comme pour les autres fournisseurs, testez ses chiffres de précision sur vos propres données.
Comment l’intégrer
Le workflow API est classique :
- Créez un compte.
- Obtenez une clé API.
- Authentifiez les requêtes avec un token Bearer.
- Envoyez l’image.
- Récupérez le rapport complet en réponse.
Exemple de structure d’intégration :
async function detectWithAiOrNot(imageUrl) {
const response = await fetch("https://api.example.com/detect", {
method: "POST",
headers: {
"Authorization": `Bearer ${process.env.AI_OR_NOT_API_KEY}`,
"Content-Type": "application/json"
},
body: JSON.stringify({ url: imageUrl })
});
if (!response.ok) {
throw new Error(`Detection failed: ${response.status}`);
}
return response.json();
}
Vérifiez les plans et limites sur la documentation de l’API AI or Not.
Avantages
- Endpoint synchrone simple.
- Produit centré sur la détection.
- Attribution du générateur, deepfake et signaux qualité dans un même rapport.
- Inscription ouverte avec possibilité d’évaluation.
Inconvénients
- Entreprise plus petite que les fournisseurs de modération établis.
- Détails publics de tarification plus limités.
Reality Defender
Reality Defender est spécialisé dans la détection de deepfakes. Historiquement orienté enterprise et gouvernements, le produit a ouvert une API développeur publique et un niveau gratuit.
Ce qu’il détecte
Reality Defender est surtout pertinent pour :
- deepfakes ;
- visages manipulés ;
- médias synthétiques ;
- images suspectes dans des workflows d’identité ;
- audio synthétique.
La vidéo est indiquée comme ajout prévu. Si votre risque principal est l’usurpation d’identité, c’est l’un des fournisseurs les plus spécialisés.
Comment l’intégrer
Le parcours développeur :
- Créez un compte RealAPI.
- Générez une clé API.
- Authentifiez vos requêtes avec cette clé.
- Envoyez les médias à scanner.
- Interprétez le score retourné.
- Routez les cas ambigus vers une revue humaine.
Consultez la page API de Reality Defender pour les niveaux actuels.
Avantages
- Spécialiste deepfake.
- Niveau gratuit public.
- SDK disponibles en plusieurs langages : Python, TypeScript, Go, Rust, Java.
- Approche multi-modèles.
Inconvénients
- Moins généraliste pour l’art IA que certains fournisseurs plus larges.
- Allocation gratuite limitée, adaptée à l’évaluation plutôt qu’à la production.
Classificateur de détection DALL-E 3 d’OpenAI
OpenAI a développé un classificateur pour estimer si une image provient de DALL-E 3. Il est utile à connaître, mais ce n’est pas une API publique généraliste.
Ce qu’il détecte
Le classificateur DALL-E 3 est binaire : il estime si une image provient spécifiquement de DALL-E 3. Il retourne un verdict et un score continu.
Sa portée est limitée :
- DALL-E 3 uniquement ;
- pas Midjourney ;
- pas Stable Diffusion ;
- pas Flux ;
- pas autres générateurs.
OpenAI a communiqué des résultats internes élevés sur ses propres images, mais ces chiffres ne remplacent pas une évaluation indépendante sur votre trafic.
Fonctionnement de l’accès
L’accès passe par le programme de recherche d’OpenAI. Il vise les laboratoires de recherche et organisations journalistiques à but non lucratif. Ce n’est pas une API développeur publique sur laquelle construire une fonctionnalité de production.
OpenAI décrit cette approche dans son article sur l’avancement de la provenance de contenu, qui couvre aussi C2PA et SynthID.
Pourquoi c’est important
Même si vous ne pouvez pas l’intégrer directement, cette direction montre une tendance : la provenance et le watermarking deviennent aussi importants que la classification probabiliste.
Pour une architecture durable, prévoyez de lire :
- les informations d’identification du contenu C2PA ;
- les signaux de filigrane comme SynthID ;
- les métadonnées d’origine ;
- les scores de détecteurs.
Avantages
- Haute précision signalée sur DALL-E 3.
- Verdict binaire plus score continu.
Inconvénients
- Accès recherche uniquement.
- Couverture limitée à DALL-E 3.
- Pas adapté à une fonctionnalité produit aujourd’hui.
Illuminarty
Illuminarty propose un outil web grand public et une API développeur. C’est une option intéressante si vous cherchez une tarification publiée et une détection localisée.
Ce qu’il détecte
Illuminarty vérifie si une image est générée par IA, estime le générateur probable et peut indiquer les régions de l’image qui semblent synthétiques.
La détection localisée est utile pour les images partiellement manipulées :
- visage modifié ;
- arrière-plan généré ;
- objet ajouté ;
- zone recomposée.
Comment l’intégrer
Le modèle est à plusieurs niveaux :
- Créez un compte.
- Choisissez un plan selon vos besoins.
- Utilisez l’API pour classifier les images.
- Activez les options avancées si vous avez besoin d’identification de modèle ou de localisation.
- Comparez les quotas quotidiens avec votre volume réel.
Vérifiez les niveaux actuels sur le site d’Illuminarty.
Avantages
- Tarification publiée.
- Détection localisée.
- Plan gratuit pour classification de base.
Inconvénients
- Fournisseur plus petit que les grandes plateformes de modération.
- Couverture des générateurs à valider sur vos propres images.
Modèles de classificateurs hébergés par Hugging Face
Hugging Face n’est pas un fournisseur spécialisé en détection. C’est un hub de modèles. Mais vous pouvez y exécuter des modèles open source de détection d’images IA via inférence hébergée ou auto-hébergement.
Ce qu’ils détectent
Tout dépend du modèle choisi.
Le Hub contient des modèles communautaires entraînés pour classifier les images comme :
- générées par IA ;
- créées par humain ;
- issues de certains générateurs ;
- manipulées ou non.
Certains reposent sur SigLIP, Vision Transformers ou d’autres architectures de vision.
Vous devez vérifier pour chaque modèle :
- données d’entraînement ;
- générateurs couverts ;
- licence ;
- métriques ;
- date de dernière mise à jour ;
- compatibilité production.
Comment l’intégrer
Trois options :
- API d’inférence serverless Hugging Face pour tests et faible trafic.
- Endpoint d’inférence dédié pour production stable.
- Auto-hébergement si vous voulez contrôler coût, latence et données.
Exemple conceptuel d’appel REST :
async function callHuggingFace(imageBuffer) {
const response = await fetch(
"https://api-inference.huggingface.co/models/namespace/model-name",
{
method: "POST",
headers: {
"Authorization": `Bearer ${process.env.HF_TOKEN}`,
"Content-Type": "application/octet-stream"
},
body: imageBuffer
}
);
return response.json();
}
Parcourez les modèles sur huggingface.co.
Avantages
- Contrôle maximal.
- Possibilité d’affiner ou d’auto-héberger.
- Pas de verrouillage fournisseur.
- Coût potentiellement plus faible à grande échelle.
Inconvénients
- Qualité très variable selon les modèles.
- Pas de garantie fournisseur sur la précision.
- Maintenance à votre charge.
- Couverture parfois en retard sur les générateurs récents.
- Plus d’ingénierie qu’une API prête à l’emploi.
Si vous choisissez cette voie, créer votre propre API de détection d’images IA explique comment encapsuler un modèle dans un service.
Tableau comparatif
| Fournisseur | Inscription ouverte | Ce qu’il détecte | Style d’API | Attribution du générateur | Support deepfake | Niveau gratuit | Modèle de tarification |
|---|---|---|---|---|---|---|---|
| Hive Moderation | Oui, en libre-service | Images, vidéo, audio IA | REST | Oui, générateur probable | Oui | Crédits de démarrage | Libre-service + devis enterprise |
| Sightengine | Oui | Images IA, vidéos IA, deepfakes | REST + SDKs Python, PHP, Node | Oui, scores par générateur | Oui | Oui, sans limite de temps | Niveaux mensuels, opérations |
| AI or Not | Oui | Images IA, audio IA, deepfakes | REST synchrone | Oui | Oui | Vérifications gratuites unitaires | API payante pour volume et usage commercial |
| Reality Defender | Oui | Deepfakes, images IA, audio | REST + SDKs Python, TS, Go, Rust, Java | Axé détection | Oui, force principale | Oui, petite allocation mensuelle | Gratuit + plans payants |
| OpenAI DALL-E 3 classifier | Non, recherche uniquement | Images DALL-E 3 uniquement | REST | Non, limité à DALL-E 3 | Non | Crédits recherche uniquement | Programme d’accès chercheurs |
| Illuminarty | Oui | Images IA, régions localisées | REST | Oui, modèle probable | Limité | Oui, classification de base | Niveaux mensuels publiés |
| Hugging Face hosted models | Oui, compte HF | Dépend du modèle | Inférence REST | Dépend du modèle | Dépend du modèle | Usage serverless limité | Par usage ou endpoint dédié |
Considérez tous ces résultats comme conditionnels. Aucune option ne remplace une authentification forte, une revue humaine ou des signaux de provenance.
Implémentation recommandée
Pour intégrer une API de détection sans bloquer votre produit sur un seul fournisseur, créez une couche d’abstraction interne.
Exemple :
type DetectionProvider = "sightengine" | "hive" | "ai_or_not" | "reality_defender";
type DetectionResult = {
provider: DetectionProvider;
aiScore: number;
deepfakeScore?: number;
generator?: string;
raw: unknown;
};
async function detectImage(imageUrl: string): Promise<DetectionResult> {
const result = await callPrimaryProvider(imageUrl);
return {
provider: "sightengine",
aiScore: result.ai_score,
deepfakeScore: result.deepfake_score,
generator: result.top_generator,
raw: result
};
}
Puis centralisez vos règles métier :
function routeDetection(result: DetectionResult) {
if (result.deepfakeScore && result.deepfakeScore >= 0.90) {
return "manual_review";
}
if (result.aiScore >= 0.95) {
return "hold";
}
if (result.aiScore >= 0.70) {
return "manual_review";
}
return "allow";
}
Cela vous permet de changer de fournisseur sans réécrire toute votre application.
Checklist avant production
Avant de déployer :
- [ ] Tester chaque fournisseur sur vos propres images.
- [ ] Mesurer latence moyenne, p95 et p99.
- [ ] Définir des seuils différents pour blocage, revue et autorisation.
- [ ] Prévoir une revue humaine pour les scores ambigus.
- [ ] Journaliser le fournisseur, le score et la version de règle utilisée.
- [ ] Gérer les timeouts et les erreurs API.
- [ ] Prévoir un fallback si le fournisseur est indisponible.
- [ ] Vérifier rétention, confidentialité et conformité.
- [ ] Estimer le coût réel selon votre volume.
- [ ] Refaire les tests régulièrement avec de nouveaux générateurs.
Conclusion
La détection d’images IA est utile, mais elle n’est pas magique. Utilisez-la comme un signal dans un système plus large.
- Pour une API développeur générale avec inscription ouverte et attribution de générateur, commencez par Sightengine ou Hive Moderation.
- Pour un endpoint synchrone simple qui retourne un rapport complet, essayez AI or Not.
- Pour les deepfakes et la manipulation de visages, Reality Defender est le spécialiste.
- Le classificateur DALL-E 3 d’OpenAI est réservé à la recherche.
- Illuminarty est une option abordable avec détection localisée.
- Les modèles hébergés par Hugging Face conviennent aux équipes qui veulent plus de contrôle et acceptent plus de travail d’ingénierie.
La bonne méthode reste de tester. Intégrez les endpoints de chaque fournisseur dans Apidog, envoyez vos images réelles, inspectez le JSON, mesurez la latence depuis votre région et comparez les résultats avant d’écrire votre logique de production.





Top comments (0)