Os geradores de imagem de IA ficaram bons rapidamente. Uma foto de uma pessoa que nunca existiu, uma foto de produto que nunca foi fotografada ou um “screenshot” de um evento que nunca aconteceu podem ser produzidos em segundos e publicados antes que alguém olhe duas vezes. Se você opera um marketplace, app de namoro, plataforma de notícias, fluxo de verificação de identidade ou feed de conteúdo gerado por usuário, em algum momento precisará responder programaticamente: esta imagem foi feita por uma máquina?
APIs de detecção de imagem de IA tentam responder a essa pergunta. Você envia uma imagem e recebe uma probabilidade, às vezes acompanhada de uma estimativa sobre qual modelo a produziu. O problema é que o mercado é ruidoso: alguns “detectores” são ferramentas web para consumidores, sem API real; outros exigem contato comercial; poucos oferecem uma API de desenvolvedor com inscrição aberta, autenticação clara e documentação REST utilizável.
RESUMO
Para uma API de desenvolvedor com inscrição aberta, atribuição de modelo e documentação REST clara, Sightengine e Hive Moderation são as opções gerais mais fortes. AI or Not fica logo atrás, com um endpoint síncrono simples. Reality Defender é a escolha mais adequada quando deepfakes, especialmente rostos manipulados, são sua principal preocupação, e possui um nível gratuito público. O classificador DALL-E 3 da OpenAI é apenas para acesso de pesquisa, não uma API geral de produção.
Nenhum detector é conclusivo. Trate cada pontuação como um sinal de risco, não como um veredito automático.
Como avaliar uma API de detecção de imagem de IA
Antes de comparar fornecedores, defina como a detecção entrará no seu produto. Um detector que parece ótimo em benchmark pode ser inadequado para o seu fluxo real.
1. Meça precisão nos seus próprios dados
Todo fornecedor cita um número de precisão. Use esse número apenas como ponto de partida.
A precisão depende de fatores como:
- quais geradores foram usados no teste;
- se as imagens foram redimensionadas;
- se foram recompactadas como JPEG;
- se são screenshots;
- se foram cortadas;
- quão recentes são os modelos generativos avaliados.
Um detector treinado nos modelos do ano passado pode degradar contra modelos novos. Um número medido em imagens limpas e em resolução total pode não se manter em um JPEG de 600px salvo novamente várias vezes.
Monte um conjunto de teste próprio:
/dataset
/real
foto-real-001.jpg
foto-real-002.jpg
/ai
midjourney-001.jpg
stable-diffusion-001.jpg
dalle-001.jpg
/edited
screenshot-001.jpg
recompressed-001.jpg
cropped-001.jpg
Depois, registre para cada imagem:
{
"image": "midjourney-001.jpg",
"expected": "ai",
"provider": "example-provider",
"score": 0.91,
"generator_guess": "midjourney",
"latency_ms": 342
}
Isso permite comparar fornecedores com base no tráfego que você realmente recebe.
2. Defina o custo de falso positivo e falso negativo
Existem duas formas principais de errar:
- Falso negativo: conteúdo sintético passa como real.
- Falso positivo: uma imagem real é marcada como sintética.
Para muitos produtos, o falso positivo é o erro mais caro, porque pode acusar um usuário legítimo de fraude.
Em vez de bloquear automaticamente qualquer imagem acima de um limite arbitrário, use faixas de decisão:
function classifyAiRisk(score) {
if (score >= 0.90) {
return "high_risk"; // bloquear, revisar ou exigir verificação adicional
}
if (score >= 0.60) {
return "needs_review"; // enviar para revisão humana
}
return "low_risk"; // permitir
}
A regra exata depende do seu produto. O importante é usar uma pontuação contínua, não apenas um true/false.
3. Teste latência no fluxo real de upload
Se a detecção roda durante o upload, ela fica entre o usuário e a tela de sucesso. Uma chamada síncrona de 2 segundos muda a experiência do produto; uma chamada de 200 ms é outra coisa.
Meça:
- tempo médio;
- p95 e p99;
- impacto do tamanho da imagem;
- comportamento sob limites de taxa;
- latência a partir da sua região.
Exemplo simples de medição em Node.js:
const startedAt = performance.now();
const response = await fetch("https://api.exemplo.com/detect", {
method: "POST",
headers: {
Authorization: `Bearer ${process.env.API_KEY}`
},
body: formData
});
const durationMs = performance.now() - startedAt;
const result = await response.json();
console.log({
durationMs,
result
});
Para produção, registre esses dados em logs ou métricas para comparar provedores com consistência.
4. Verifique cobertura de modelos
“Gerado por IA” não é uma categoria única. Detectores são treinados contra famílias específicas de geradores, como:
- Midjourney;
- Stable Diffusion;
- DALL-E;
- Flux;
- Firefly;
- Imagen;
- modelos mais recentes ou proprietários.
Se você precisa saber apenas se a imagem parece sintética, uma pontuação geral pode bastar. Se você precisa atribuir o provável gerador, procure uma API que retorne pontuações por modelo.
Exemplo de resposta útil:
{
"ai_score": 0.87,
"generators": {
"midjourney": 0.72,
"stable_diffusion": 0.14,
"dalle": 0.06
}
}
5. Separe detecção de imagem sintética e deepfake
Detectar uma imagem totalmente sintética é diferente de detectar um rosto manipulado em uma foto real.
Deepfakes envolvem casos como:
- troca de rosto;
- reencenação facial;
- manipulação parcial;
- personificação em verificação de identidade.
Algumas APIs fazem as duas coisas. Outras são fortes em uma área e fracas na outra. Se o seu risco principal é personificação, priorize uma API especializada em deepfake.
6. Mapeie preço para o seu volume real
Fornecedores cobram de formas diferentes:
- por imagem;
- por operação;
- por crédito;
- por nível mensal;
- por excedente;
- por cotação empresarial.
Antes de escolher, transforme seu volume em custo esperado:
uploads por dia: 50.000
imagens verificadas por upload: 1
verificações por mês: 1.500.000
custo por verificação: consultar plano do fornecedor
Se uma verificação avançada consome múltiplas “operações”, inclua isso no cálculo.
7. Revise privacidade e residência de dados
Você está enviando imagens de usuários para terceiros. Antes de integrar:
- leia os termos de tratamento de dados;
- verifique se imagens são retidas;
- confirme por quanto tempo são armazenadas;
- entenda se o fornecedor treina modelos com seus dados;
- avalie opções on-premise ou regionais, se necessário.
Para uma análise mais detalhada dos limites técnicos, veja por que a detecção de imagem de IA falha.
Hive Moderation
Hive — também conhecida como Hive AI e Hive Moderation — é um fornecedor estabelecido de moderação de conteúdo. Sua detecção de conteúdo gerado por IA e deepfake se conecta aos produtos de moderação visual, texto e áudio.
O que detecta
O classificador de conteúdo gerado por IA do Hive retorna uma pontuação de confiança indicando se uma imagem é gerada por IA. Ele também retorna o provável motor generativo que a produziu.
A linha de produtos cobre imagens, vídeo e áudio, além de detecção de deepfake separada.
Como o acesso funciona
O Hive oferece um plano de desenvolvedor self-service. Você se cadastra, adiciona um método de pagamento e recebe créditos iniciais gratuitos para testar.
O fluxo básico é:
- criar conta;
- gerar uma chave de API V3;
- enviar imagens para o endpoint;
- interpretar a pontuação retornada;
- ajustar limites de decisão no seu backend.
Para tráfego sustentado de alto volume, é necessário falar com o Hive para um plano empresarial com limites de taxa e preços personalizados. Implantação on-premise está disponível para clientes empresariais.
Consulte os valores atuais na página de preços do Hive.
Prós
- Produto maduro e amplamente implantado.
- Nível self-service real para desenvolvimento.
- Retorna provável gerador de origem, não apenas um binário.
- Cobre imagens, vídeo, áudio e moderação mais ampla.
- Opção on-premise para implantações sensíveis à privacidade.
Contras
- Limites de taxa padrão do self-service podem ser modestos.
- Volume alto normalmente exige conversa empresarial.
- Preços de níveis superiores são por cotação.
- A precisão varia por gerador e qualidade da imagem.
Sightengine
Sightengine é uma empresa de API de análise de imagem e moderação de conteúdo. Sua detecção de imagem gerada por IA tem uma das experiências de desenvolvedor mais diretas desta lista.
O que detecta
Sightengine determina se uma imagem foi gerada por um modelo de IA e calcula pontuações de confiança por gerador.
A documentação lista cobertura para geradores como:
- Stable Diffusion;
- Midjourney;
- saída de imagem DALL-E / GPT;
- Flux;
- Firefly;
- modelos de imagem do Google;
- Seedream;
- outros modelos recentes.
Também oferece detecção de vídeo gerado por IA e detecção de deepfake como verificações separadas.
Como o acesso funciona
A inscrição é aberta. O Sightengine tem um plano gratuito sem limite de tempo para testes, com limite mensal de operações e limite diário.
O uso é medido em “operações”. Verificações avançadas, como detecção de imagem gerada por IA, podem consumir mais operações por chamada do que uma verificação padrão de moderação.
Fluxo recomendado:
- crie uma conta;
- gere suas credenciais;
- envie um lote de imagens reais e sintéticas;
- registre pontuações por gerador;
- calcule custo real com base em operações consumidas.
Confirme os números atuais na página de preços do Sightengine.
Prós
- Documentação focada em desenvolvedores.
- SDKs oficiais em Python, PHP e Node.
- Pontuações por gerador na resposta.
- Nível gratuito real, sem limite de tempo.
- Cobre imagem de IA, vídeo de IA e deepfake.
Contras
- O modelo de cobrança por “operações” exige cálculo cuidadoso.
- Detecção de geradores novos depende de retreinamento.
- Como todos os detectores, pode degradar com compressão, corte e modelos recentes.
AI or Not
AI or Not é uma startup focada em detecção. Diferente dos grandes fornecedores de moderação, detecção de mídia gerada por IA e manipulada é seu produto principal.
O que detecta
AI or Not classifica se uma imagem é gerada por IA e retorna sinais específicos do gerador, como Midjourney ou DALL-E. Também inclui detecção de deepfake e algumas facetas adicionais, como NSFW e qualidade de imagem.
A empresa publica seus próprios números de precisão. Como em qualquer fornecedor, valide esses números em seus próprios dados antes de confiar no resultado em produção.
Como o acesso funciona
A inscrição é aberta. Você cria uma conta, obtém uma chave de API e chama a API com autenticação Bearer.
O uso típico é:
POST /detect
Authorization: Bearer SUA_CHAVE
Content-Type: multipart/form-data
A vantagem prática é o modelo síncrono: uma requisição retorna um relatório completo.
AI or Not oferece verificações gratuitas de imagem única no site e uma API paga para uso em massa e comercial. Consulte planos e limites na documentação da API AI or Not.
Prós
- Endpoint síncrono simples.
- Uma requisição retorna um relatório completo.
- Detecção é o produto principal.
- Retorna atribuição do gerador, deepfake e sinais de qualidade.
- Inscrição aberta com caminho gratuito para avaliação.
Contras
- Empresa menor do que fornecedores de moderação estabelecidos.
- Avalie SLAs, suporte e continuidade para uso crítico.
- Detalhes públicos de preço podem exigir leitura da documentação ou contato com a equipe.
Reality Defender
Reality Defender é uma empresa de detecção de deepfake que historicamente vendia para empresas e governos. Em 2025, abriu uma API pública para desenvolvedores e um nível gratuito, tornando-se acessível a desenvolvedores individuais em 2026.
O que detecta
A força do Reality Defender está em deepfakes: mídia manipulada e sintética, com foco que vai além de rostos para detecção sensível ao contexto de imagens sintéticas.
Atualmente, suporta detecção de imagem e áudio, com vídeo listado como adição planejada.
Se o seu risco principal é personificação ou manipulação facial, em vez de arte de IA genérica, este é o especialista mais relevante da lista.
Como o acesso funciona
A API é pública e possui nível gratuito. O fluxo é:
- criar uma conta RealAPI na plataforma Reality Defender;
- gerar uma chave de API;
- autenticar requisições com essa chave;
- enviar imagens ou áudio para análise;
- tratar o resultado como sinal de risco.
O nível gratuito fornece uma pequena permissão mensal de varreduras para avaliação. Planos pagos aumentam os limites.
Consulte os níveis atuais na página da API do Reality Defender.
Prós
- Especialista em deepfake.
- Histórico empresarial, agora com API pública.
- Nível gratuito para avaliação sem ligação de vendas.
- SDKs em Python, TypeScript, Go, Rust e Java, além de HTTPS direto.
- Detecção multi-modelo, não apenas um classificador único.
Contras
- Produto centrado em deepfakes e áudio.
- Para detecção genérica de arte de IA, outro fornecedor pode cobrir mais geradores.
- Permissão gratuita é pequena e voltada a avaliação, não produção.
Classificador de detecção DALL-E 3 da OpenAI
A OpenAI construiu um classificador que prevê se uma imagem veio de seu próprio modelo DALL-E 3. Ele é importante para entender a direção do setor, mas não é uma API geral para a qual qualquer desenvolvedor possa se inscrever hoje.
O que detecta
O Classificador de Detecção DALL-E é um classificador binário que estima a probabilidade de uma imagem ter sido originada especificamente do DALL-E 3.
Ele retorna:
- resultado verdadeiro/falso;
- pontuação contínua.
O escopo é estreito: ele é ajustado para DALL-E 3, não para Midjourney, Stable Diffusion ou outros geradores. A OpenAI relatou alta precisão interna em imagens DALL-E 3 com baixa taxa de falsos positivos, mas esses números são internos e focados no próprio modelo da OpenAI.
Como o acesso funciona
O acesso é restrito pelo Programa de Acesso a Pesquisadores da OpenAI.
Ele é destinado a:
- laboratórios de pesquisa;
- organizações jornalísticas sem fins lucrativos;
- grupos orientados à pesquisa.
Não é uma API pública de desenvolvedor com inscrição aberta. Portanto, não planeje um produto de produção em torno dela.
A OpenAI descreveu esse trabalho em sua postagem de maio de 2026 sobre o avanço da proveniência de conteúdo, que também aborda a adesão ao Comitê Diretor da C2PA e a adição de marca d'água SynthID à sua saída de imagem.
Por que ainda importa
Mesmo que você não possa chamá-lo, o classificador mostra uma direção importante: a indústria está migrando para metadados de proveniência e marca d'água, não apenas classificação probabilística.
Se você está construindo para longo prazo, acompanhe:
- Credenciais de Conteúdo C2PA;
- SynthID;
- sinais de proveniência incorporados ao arquivo;
- pontuações probabilísticas de detectores.
Prós
- Alta precisão relatada em imagens DALL-E 3.
- Retorna veredito binário e pontuação contínua.
Contras
- Acesso apenas para pesquisa.
- Sem inscrição aberta para desenvolvedores.
- Restrito ao DALL-E 3.
- Não é adequado para construir um recurso de produção hoje.
Illuminarty
Illuminarty é um serviço de detecção com ferramenta web para consumidores e API de desenvolvedor. É uma das opções mais acessíveis com estrutura de preços publicada.
O que detecta
Illuminarty verifica se uma imagem foi gerada por IA, estima qual gerador foi provavelmente usado e oferece detecção localizada.
A detecção localizada é útil quando você suspeita de edições parciais, por exemplo:
- rosto manipulado em uma foto real;
- fundo sintético;
- objeto inserido;
- composição parcialmente gerada.
Como o acesso funciona
A inscrição é aberta e baseada em níveis.
Illuminarty publica:
- plano gratuito para classificação básica de imagem e texto;
- níveis mensais pagos;
- identificação de modelo em planos superiores;
- detecção localizada;
- limites diários de requisições mais altos.
Confirme os níveis e limites atuais no site do Illuminarty antes de se comprometer, pois os detalhes do plano podem mudar.
Prós
- Estrutura de preços publicada.
- Plano gratuito para classificação básica.
- Detecção localizada mostra quais regiões parecem sintéticas.
- Útil para análise de manipulação parcial.
Contras
- Operação menor do que grandes fornecedores de moderação.
- Avalie SLAs e suporte de longo prazo.
- Verifique a cobertura de geradores contra seu tráfego real.
Modelos de classificador hospedados no Hugging Face
Esta opção é diferente. Hugging Face não é uma empresa de detecção; é um hub de modelos. Ainda assim, você pode executar modelos de detecção de imagem de IA de código aberto por inferência hospedada ou auto-hospedagem.
O que detecta
Depende totalmente do modelo escolhido.
O Hub hospeda classificadores de imagem da comunidade treinados para rotular imagens como geradas por IA ou feitas por humanos. Esses modelos podem usar arquiteturas como SigLIP ou Vision Transformers.
Cada modelo possui:
- dados de treinamento próprios;
- geradores suportados;
- métricas próprias;
- pontos cegos;
- frequência de manutenção diferente.
Não há garantia de fornecedor. Você escolhe o modelo e herda suas limitações.
Como o acesso funciona
Você precisa de:
- conta Hugging Face;
- token de acesso;
- modelo escolhido;
- decisão entre inferência hospedada, endpoint dedicado ou auto-hospedagem.
Caminhos possíveis:
- usar a API de Inferência sem servidor para uso leve;
- implantar um Endpoint de Inferência dedicado para produção;
- baixar os pesos e hospedar em sua própria infraestrutura.
Explore modelos em huggingface.co.
Exemplo conceitual de chamada para inferência:
const response = await fetch(
"https://api-inference.huggingface.co/models/ORG/MODELO",
{
method: "POST",
headers: {
Authorization: `Bearer ${process.env.HF_TOKEN}`,
"Content-Type": "application/octet-stream"
},
body: imageBuffer
}
);
const result = await response.json();
console.log(result);
A implementação exata depende do modelo.
Prós
- Controle máximo sobre modelo e infraestrutura.
- Possibilidade de inspecionar, ajustar ou auto-hospedar.
- Potencialmente menor custo em escala.
- Menor dependência de fornecedor fechado.
Contras
- Sem garantia de precisão ou suporte.
- Qualidade varia muito entre modelos da comunidade.
- Você gerencia avaliação, atualizações e uptime.
- Muitos modelos ficam atrás dos geradores mais recentes.
- Exige mais engenharia do que uma API pronta.
Se você seguir esse caminho, veja como construir sua própria API de detector de imagem de IA encapsulando um modelo em um serviço.
Tabela de comparação
| Fornecedor | Inscrição aberta | O que detecta | Estilo da API | Atribuição do gerador | Suporte a Deepfake | Nível gratuito | Modelo de precificação |
|---|---|---|---|---|---|---|---|
| Hive Moderation | Sim, self-service | Imagens, vídeo, áudio de IA | REST | Sim, prevê o gerador | Sim | Créditos iniciais na inscrição | Self-service mais cotação empresarial |
| Sightengine | Sim | Imagens, vídeo, deepfakes de IA | REST mais SDKs (Python, PHP, Node) | Sim, pontuações por gerador | Sim | Sim, sem limite de tempo | Níveis mensais, cobrado em operações |
| AI or Not | Sim | Imagens, áudio, deepfakes de IA | REST, endpoint síncrono | Sim, por gerador | Sim | Verificações gratuitas de imagem única | API paga para uso em massa e comercial |
| Reality Defender | Sim, API pública | Deepfakes, imagens, áudio de IA | REST mais SDKs (Python, TS, Go, Rust, Java) | Focado em detecção | Sim, principal força | Sim, pequena permissão mensal | Nível gratuito mais planos pagos |
| Classificador DALL-E 3 da OpenAI | Não, apenas acesso para pesquisa | Apenas imagens DALL-E 3 | REST | Não, escopo DALL-E 3 | Não | Apenas créditos de pesquisa | Programa de Acesso a Pesquisadores |
| Illuminarty | Sim | Imagens de IA, regiões localizadas | REST | Sim, modelo provável | Limitado | Sim, classificação básica | Níveis mensais publicados |
| Modelos hospedados no Hugging Face | Sim (conta HF) | Depende do modelo escolhido | Inferência REST | Depende do modelo | Depende do modelo | Uso gratuito sem servidor, limitado | Por uso ou endpoint dedicado |
Considere a precisão de cada opção como condicional. Nenhuma delas autentica uma imagem de forma conclusiva.
Como integrar uma API de detecção no seu backend
Um fluxo seguro evita bloquear usuários com base em uma única pontuação.
Fluxo recomendado
Usuário faz upload
↓
Backend armazena imagem temporariamente
↓
Backend chama API de detecção
↓
Pontuação é registrada
↓
Regra de decisão:
- baixo risco: aprovar
- médio risco: revisão humana
- alto risco: bloquear ou exigir verificação adicional
↓
Resultado é salvo para auditoria
Exemplo de decisão no backend
function decideAction({ aiScore, deepfakeScore }) {
if (deepfakeScore >= 0.85) {
return {
action: "manual_review",
reason: "high_deepfake_risk"
};
}
if (aiScore >= 0.90) {
return {
action: "manual_review",
reason: "high_ai_generation_risk"
};
}
if (aiScore >= 0.60) {
return {
action: "soft_flag",
reason: "medium_ai_generation_risk"
};
}
return {
action: "approve",
reason: "low_risk"
};
}
Campos úteis para salvar
{
"image_id": "img_123",
"provider": "sightengine",
"ai_score": 0.74,
"deepfake_score": 0.12,
"generator_guess": "midjourney",
"decision": "soft_flag",
"latency_ms": 281,
"created_at": "2026-06-08T10:30:00Z"
}
Esses registros ajudam a:
- auditar decisões;
- ajustar thresholds;
- comparar fornecedores;
- medir falsos positivos;
- responder a contestações de usuários.
Conclusão
Detecção de imagem de IA é útil, mas não é mágica. Use como sinal dentro de um sistema maior, não como veredito final.
- Para uma API geral com inscrição aberta e atribuição de gerador, comece com Sightengine ou Hive Moderation.
- Para um endpoint síncrono simples que retorna tudo em uma única chamada, teste AI or Not.
- Para deepfakes e manipulação de rosto, Reality Defender é o especialista e tem nível gratuito público.
- O classificador DALL-E 3 da OpenAI é apenas para acesso de pesquisa; não planeje um produto em torno dele.
- Illuminarty é uma opção econômica com detecção localizada.
- Modelos hospedados no Hugging Face funcionam melhor para equipes que querem controle e aceitam gerenciar a engenharia.
- Nenhuma API é conclusiva. Valide em seu próprio tráfego, projete para falsos positivos e envie pontuações limítrofes para revisão humana.
A forma mais confiável de escolher é testar. Conecte o endpoint de cada provedor ao Apidog, envie imagens reais, inspecione o JSON, meça a latência da sua região e compare os resultados lado a lado antes de escrever uma única linha de código de produção.





Top comments (0)