Lucas

Posted on Jun 8 • Originally published at apidog.com

Melhores APIs de Detecção de Imagens com IA para Desenvolvedores (2026)

Os geradores de imagem de IA ficaram bons rapidamente. Uma foto de uma pessoa que nunca existiu, uma foto de produto que nunca foi fotografada ou um “screenshot” de um evento que nunca aconteceu podem ser produzidos em segundos e publicados antes que alguém olhe duas vezes. Se você opera um marketplace, app de namoro, plataforma de notícias, fluxo de verificação de identidade ou feed de conteúdo gerado por usuário, em algum momento precisará responder programaticamente: esta imagem foi feita por uma máquina?

Experimente o Apidog hoje

APIs de detecção de imagem de IA tentam responder a essa pergunta. Você envia uma imagem e recebe uma probabilidade, às vezes acompanhada de uma estimativa sobre qual modelo a produziu. O problema é que o mercado é ruidoso: alguns “detectores” são ferramentas web para consumidores, sem API real; outros exigem contato comercial; poucos oferecem uma API de desenvolvedor com inscrição aberta, autenticação clara e documentação REST utilizável.

RESUMO

Para uma API de desenvolvedor com inscrição aberta, atribuição de modelo e documentação REST clara, Sightengine e Hive Moderation são as opções gerais mais fortes. AI or Not fica logo atrás, com um endpoint síncrono simples. Reality Defender é a escolha mais adequada quando deepfakes, especialmente rostos manipulados, são sua principal preocupação, e possui um nível gratuito público. O classificador DALL-E 3 da OpenAI é apenas para acesso de pesquisa, não uma API geral de produção.

Nenhum detector é conclusivo. Trate cada pontuação como um sinal de risco, não como um veredito automático.

Como avaliar uma API de detecção de imagem de IA

Antes de comparar fornecedores, defina como a detecção entrará no seu produto. Um detector que parece ótimo em benchmark pode ser inadequado para o seu fluxo real.

1. Meça precisão nos seus próprios dados

Todo fornecedor cita um número de precisão. Use esse número apenas como ponto de partida.

A precisão depende de fatores como:

quais geradores foram usados no teste;
se as imagens foram redimensionadas;
se foram recompactadas como JPEG;
se são screenshots;
se foram cortadas;
quão recentes são os modelos generativos avaliados.

Um detector treinado nos modelos do ano passado pode degradar contra modelos novos. Um número medido em imagens limpas e em resolução total pode não se manter em um JPEG de 600px salvo novamente várias vezes.

Monte um conjunto de teste próprio:

/dataset
  /real
    foto-real-001.jpg
    foto-real-002.jpg
  /ai
    midjourney-001.jpg
    stable-diffusion-001.jpg
    dalle-001.jpg
  /edited
    screenshot-001.jpg
    recompressed-001.jpg
    cropped-001.jpg

Depois, registre para cada imagem:

{
  "image": "midjourney-001.jpg",
  "expected": "ai",
  "provider": "example-provider",
  "score": 0.91,
  "generator_guess": "midjourney",
  "latency_ms": 342
}

Isso permite comparar fornecedores com base no tráfego que você realmente recebe.

2. Defina o custo de falso positivo e falso negativo

Existem duas formas principais de errar:

Falso negativo: conteúdo sintético passa como real.
Falso positivo: uma imagem real é marcada como sintética.

Para muitos produtos, o falso positivo é o erro mais caro, porque pode acusar um usuário legítimo de fraude.

Em vez de bloquear automaticamente qualquer imagem acima de um limite arbitrário, use faixas de decisão:

function classifyAiRisk(score) {
  if (score >= 0.90) {
    return "high_risk"; // bloquear, revisar ou exigir verificação adicional
  }

  if (score >= 0.60) {
    return "needs_review"; // enviar para revisão humana
  }

  return "low_risk"; // permitir
}

A regra exata depende do seu produto. O importante é usar uma pontuação contínua, não apenas um true/false.

3. Teste latência no fluxo real de upload

Se a detecção roda durante o upload, ela fica entre o usuário e a tela de sucesso. Uma chamada síncrona de 2 segundos muda a experiência do produto; uma chamada de 200 ms é outra coisa.

Meça:

tempo médio;
p95 e p99;
impacto do tamanho da imagem;
comportamento sob limites de taxa;
latência a partir da sua região.

Exemplo simples de medição em Node.js:

const startedAt = performance.now();

const response = await fetch("https://api.exemplo.com/detect", {
  method: "POST",
  headers: {
    Authorization: `Bearer ${process.env.API_KEY}`
  },
  body: formData
});

const durationMs = performance.now() - startedAt;
const result = await response.json();

console.log({
  durationMs,
  result
});

Para produção, registre esses dados em logs ou métricas para comparar provedores com consistência.

4. Verifique cobertura de modelos

“Gerado por IA” não é uma categoria única. Detectores são treinados contra famílias específicas de geradores, como:

Midjourney;
Stable Diffusion;
DALL-E;
Flux;
Firefly;
Imagen;
modelos mais recentes ou proprietários.

Se você precisa saber apenas se a imagem parece sintética, uma pontuação geral pode bastar. Se você precisa atribuir o provável gerador, procure uma API que retorne pontuações por modelo.

Exemplo de resposta útil:

{
  "ai_score": 0.87,
  "generators": {
    "midjourney": 0.72,
    "stable_diffusion": 0.14,
    "dalle": 0.06
  }
}

5. Separe detecção de imagem sintética e deepfake

Detectar uma imagem totalmente sintética é diferente de detectar um rosto manipulado em uma foto real.

Deepfakes envolvem casos como:

troca de rosto;
reencenação facial;
manipulação parcial;
personificação em verificação de identidade.

Algumas APIs fazem as duas coisas. Outras são fortes em uma área e fracas na outra. Se o seu risco principal é personificação, priorize uma API especializada em deepfake.

6. Mapeie preço para o seu volume real

Fornecedores cobram de formas diferentes:

por imagem;
por operação;
por crédito;
por nível mensal;
por excedente;
por cotação empresarial.

Antes de escolher, transforme seu volume em custo esperado:

uploads por dia: 50.000
imagens verificadas por upload: 1
verificações por mês: 1.500.000
custo por verificação: consultar plano do fornecedor

Se uma verificação avançada consome múltiplas “operações”, inclua isso no cálculo.

7. Revise privacidade e residência de dados

Você está enviando imagens de usuários para terceiros. Antes de integrar:

leia os termos de tratamento de dados;
verifique se imagens são retidas;
confirme por quanto tempo são armazenadas;
entenda se o fornecedor treina modelos com seus dados;
avalie opções on-premise ou regionais, se necessário.

Para uma análise mais detalhada dos limites técnicos, veja por que a detecção de imagem de IA falha.

Hive Moderation

Hive — também conhecida como Hive AI e Hive Moderation — é um fornecedor estabelecido de moderação de conteúdo. Sua detecção de conteúdo gerado por IA e deepfake se conecta aos produtos de moderação visual, texto e áudio.

O que detecta

O classificador de conteúdo gerado por IA do Hive retorna uma pontuação de confiança indicando se uma imagem é gerada por IA. Ele também retorna o provável motor generativo que a produziu.

A linha de produtos cobre imagens, vídeo e áudio, além de detecção de deepfake separada.

Como o acesso funciona

O Hive oferece um plano de desenvolvedor self-service. Você se cadastra, adiciona um método de pagamento e recebe créditos iniciais gratuitos para testar.

O fluxo básico é:

criar conta;
gerar uma chave de API V3;
enviar imagens para o endpoint;
interpretar a pontuação retornada;
ajustar limites de decisão no seu backend.

Para tráfego sustentado de alto volume, é necessário falar com o Hive para um plano empresarial com limites de taxa e preços personalizados. Implantação on-premise está disponível para clientes empresariais.

Consulte os valores atuais na página de preços do Hive.

Prós

Produto maduro e amplamente implantado.
Nível self-service real para desenvolvimento.
Retorna provável gerador de origem, não apenas um binário.
Cobre imagens, vídeo, áudio e moderação mais ampla.
Opção on-premise para implantações sensíveis à privacidade.

Contras

Limites de taxa padrão do self-service podem ser modestos.
Volume alto normalmente exige conversa empresarial.
Preços de níveis superiores são por cotação.
A precisão varia por gerador e qualidade da imagem.

Sightengine

Sightengine é uma empresa de API de análise de imagem e moderação de conteúdo. Sua detecção de imagem gerada por IA tem uma das experiências de desenvolvedor mais diretas desta lista.

O que detecta

Sightengine determina se uma imagem foi gerada por um modelo de IA e calcula pontuações de confiança por gerador.

A documentação lista cobertura para geradores como:

Stable Diffusion;
Midjourney;
saída de imagem DALL-E / GPT;
Flux;
Firefly;
modelos de imagem do Google;
Seedream;
outros modelos recentes.

Também oferece detecção de vídeo gerado por IA e detecção de deepfake como verificações separadas.

Como o acesso funciona

A inscrição é aberta. O Sightengine tem um plano gratuito sem limite de tempo para testes, com limite mensal de operações e limite diário.

O uso é medido em “operações”. Verificações avançadas, como detecção de imagem gerada por IA, podem consumir mais operações por chamada do que uma verificação padrão de moderação.

Fluxo recomendado:

crie uma conta;
gere suas credenciais;
envie um lote de imagens reais e sintéticas;
registre pontuações por gerador;
calcule custo real com base em operações consumidas.

Confirme os números atuais na página de preços do Sightengine.

Prós

Documentação focada em desenvolvedores.
SDKs oficiais em Python, PHP e Node.
Pontuações por gerador na resposta.
Nível gratuito real, sem limite de tempo.
Cobre imagem de IA, vídeo de IA e deepfake.

Contras

O modelo de cobrança por “operações” exige cálculo cuidadoso.
Detecção de geradores novos depende de retreinamento.
Como todos os detectores, pode degradar com compressão, corte e modelos recentes.

AI or Not

AI or Not é uma startup focada em detecção. Diferente dos grandes fornecedores de moderação, detecção de mídia gerada por IA e manipulada é seu produto principal.

O que detecta

AI or Not classifica se uma imagem é gerada por IA e retorna sinais específicos do gerador, como Midjourney ou DALL-E. Também inclui detecção de deepfake e algumas facetas adicionais, como NSFW e qualidade de imagem.

A empresa publica seus próprios números de precisão. Como em qualquer fornecedor, valide esses números em seus próprios dados antes de confiar no resultado em produção.

Como o acesso funciona

A inscrição é aberta. Você cria uma conta, obtém uma chave de API e chama a API com autenticação Bearer.

O uso típico é:

POST /detect
Authorization: Bearer SUA_CHAVE
Content-Type: multipart/form-data

A vantagem prática é o modelo síncrono: uma requisição retorna um relatório completo.

AI or Not oferece verificações gratuitas de imagem única no site e uma API paga para uso em massa e comercial. Consulte planos e limites na documentação da API AI or Not.

Prós

Endpoint síncrono simples.
Uma requisição retorna um relatório completo.
Detecção é o produto principal.
Retorna atribuição do gerador, deepfake e sinais de qualidade.
Inscrição aberta com caminho gratuito para avaliação.

Contras

Empresa menor do que fornecedores de moderação estabelecidos.
Avalie SLAs, suporte e continuidade para uso crítico.
Detalhes públicos de preço podem exigir leitura da documentação ou contato com a equipe.

Reality Defender

Reality Defender é uma empresa de detecção de deepfake que historicamente vendia para empresas e governos. Em 2025, abriu uma API pública para desenvolvedores e um nível gratuito, tornando-se acessível a desenvolvedores individuais em 2026.

O que detecta

A força do Reality Defender está em deepfakes: mídia manipulada e sintética, com foco que vai além de rostos para detecção sensível ao contexto de imagens sintéticas.

Atualmente, suporta detecção de imagem e áudio, com vídeo listado como adição planejada.

Se o seu risco principal é personificação ou manipulação facial, em vez de arte de IA genérica, este é o especialista mais relevante da lista.

Como o acesso funciona

A API é pública e possui nível gratuito. O fluxo é:

criar uma conta RealAPI na plataforma Reality Defender;
gerar uma chave de API;
autenticar requisições com essa chave;
enviar imagens ou áudio para análise;
tratar o resultado como sinal de risco.

O nível gratuito fornece uma pequena permissão mensal de varreduras para avaliação. Planos pagos aumentam os limites.

Consulte os níveis atuais na página da API do Reality Defender.

Prós

Especialista em deepfake.
Histórico empresarial, agora com API pública.
Nível gratuito para avaliação sem ligação de vendas.
SDKs em Python, TypeScript, Go, Rust e Java, além de HTTPS direto.
Detecção multi-modelo, não apenas um classificador único.

Contras

Produto centrado em deepfakes e áudio.
Para detecção genérica de arte de IA, outro fornecedor pode cobrir mais geradores.
Permissão gratuita é pequena e voltada a avaliação, não produção.

Classificador de detecção DALL-E 3 da OpenAI

A OpenAI construiu um classificador que prevê se uma imagem veio de seu próprio modelo DALL-E 3. Ele é importante para entender a direção do setor, mas não é uma API geral para a qual qualquer desenvolvedor possa se inscrever hoje.

O que detecta

O Classificador de Detecção DALL-E é um classificador binário que estima a probabilidade de uma imagem ter sido originada especificamente do DALL-E 3.

Ele retorna:

resultado verdadeiro/falso;
pontuação contínua.

O escopo é estreito: ele é ajustado para DALL-E 3, não para Midjourney, Stable Diffusion ou outros geradores. A OpenAI relatou alta precisão interna em imagens DALL-E 3 com baixa taxa de falsos positivos, mas esses números são internos e focados no próprio modelo da OpenAI.

Como o acesso funciona

O acesso é restrito pelo Programa de Acesso a Pesquisadores da OpenAI.

Ele é destinado a:

laboratórios de pesquisa;
organizações jornalísticas sem fins lucrativos;
grupos orientados à pesquisa.

Não é uma API pública de desenvolvedor com inscrição aberta. Portanto, não planeje um produto de produção em torno dela.

A OpenAI descreveu esse trabalho em sua postagem de maio de 2026 sobre o avanço da proveniência de conteúdo, que também aborda a adesão ao Comitê Diretor da C2PA e a adição de marca d'água SynthID à sua saída de imagem.

Por que ainda importa

Mesmo que você não possa chamá-lo, o classificador mostra uma direção importante: a indústria está migrando para metadados de proveniência e marca d'água, não apenas classificação probabilística.

Se você está construindo para longo prazo, acompanhe:

Credenciais de Conteúdo C2PA;
SynthID;
sinais de proveniência incorporados ao arquivo;
pontuações probabilísticas de detectores.

Prós

Alta precisão relatada em imagens DALL-E 3.
Retorna veredito binário e pontuação contínua.

Contras

Acesso apenas para pesquisa.
Sem inscrição aberta para desenvolvedores.
Restrito ao DALL-E 3.
Não é adequado para construir um recurso de produção hoje.

Illuminarty

Illuminarty é um serviço de detecção com ferramenta web para consumidores e API de desenvolvedor. É uma das opções mais acessíveis com estrutura de preços publicada.

O que detecta

Illuminarty verifica se uma imagem foi gerada por IA, estima qual gerador foi provavelmente usado e oferece detecção localizada.

A detecção localizada é útil quando você suspeita de edições parciais, por exemplo:

rosto manipulado em uma foto real;
fundo sintético;
objeto inserido;
composição parcialmente gerada.

Como o acesso funciona

A inscrição é aberta e baseada em níveis.

Illuminarty publica:

plano gratuito para classificação básica de imagem e texto;
níveis mensais pagos;
identificação de modelo em planos superiores;
detecção localizada;
limites diários de requisições mais altos.

Confirme os níveis e limites atuais no site do Illuminarty antes de se comprometer, pois os detalhes do plano podem mudar.

Prós

Estrutura de preços publicada.
Plano gratuito para classificação básica.
Detecção localizada mostra quais regiões parecem sintéticas.
Útil para análise de manipulação parcial.

Contras

Operação menor do que grandes fornecedores de moderação.
Avalie SLAs e suporte de longo prazo.
Verifique a cobertura de geradores contra seu tráfego real.

Modelos de classificador hospedados no Hugging Face

Esta opção é diferente. Hugging Face não é uma empresa de detecção; é um hub de modelos. Ainda assim, você pode executar modelos de detecção de imagem de IA de código aberto por inferência hospedada ou auto-hospedagem.

O que detecta

Depende totalmente do modelo escolhido.

O Hub hospeda classificadores de imagem da comunidade treinados para rotular imagens como geradas por IA ou feitas por humanos. Esses modelos podem usar arquiteturas como SigLIP ou Vision Transformers.

Cada modelo possui:

dados de treinamento próprios;
geradores suportados;
métricas próprias;
pontos cegos;
frequência de manutenção diferente.

Não há garantia de fornecedor. Você escolhe o modelo e herda suas limitações.

Como o acesso funciona

Você precisa de:

conta Hugging Face;
token de acesso;
modelo escolhido;
decisão entre inferência hospedada, endpoint dedicado ou auto-hospedagem.

Caminhos possíveis:

usar a API de Inferência sem servidor para uso leve;
implantar um Endpoint de Inferência dedicado para produção;
baixar os pesos e hospedar em sua própria infraestrutura.

Explore modelos em huggingface.co.

Exemplo conceitual de chamada para inferência:

const response = await fetch(
  "https://api-inference.huggingface.co/models/ORG/MODELO",
  {
    method: "POST",
    headers: {
      Authorization: `Bearer ${process.env.HF_TOKEN}`,
      "Content-Type": "application/octet-stream"
    },
    body: imageBuffer
  }
);

const result = await response.json();
console.log(result);

A implementação exata depende do modelo.

Prós

Controle máximo sobre modelo e infraestrutura.
Possibilidade de inspecionar, ajustar ou auto-hospedar.
Potencialmente menor custo em escala.
Menor dependência de fornecedor fechado.

Contras

Sem garantia de precisão ou suporte.
Qualidade varia muito entre modelos da comunidade.
Você gerencia avaliação, atualizações e uptime.
Muitos modelos ficam atrás dos geradores mais recentes.
Exige mais engenharia do que uma API pronta.

Se você seguir esse caminho, veja como construir sua própria API de detector de imagem de IA encapsulando um modelo em um serviço.

Tabela de comparação

Fornecedor	Inscrição aberta	O que detecta	Estilo da API	Atribuição do gerador	Suporte a Deepfake	Nível gratuito	Modelo de precificação
Hive Moderation	Sim, self-service	Imagens, vídeo, áudio de IA	REST	Sim, prevê o gerador	Sim	Créditos iniciais na inscrição	Self-service mais cotação empresarial
Sightengine	Sim	Imagens, vídeo, deepfakes de IA	REST mais SDKs (Python, PHP, Node)	Sim, pontuações por gerador	Sim	Sim, sem limite de tempo	Níveis mensais, cobrado em operações
AI or Not	Sim	Imagens, áudio, deepfakes de IA	REST, endpoint síncrono	Sim, por gerador	Sim	Verificações gratuitas de imagem única	API paga para uso em massa e comercial
Reality Defender	Sim, API pública	Deepfakes, imagens, áudio de IA	REST mais SDKs (Python, TS, Go, Rust, Java)	Focado em detecção	Sim, principal força	Sim, pequena permissão mensal	Nível gratuito mais planos pagos
Classificador DALL-E 3 da OpenAI	Não, apenas acesso para pesquisa	Apenas imagens DALL-E 3	REST	Não, escopo DALL-E 3	Não	Apenas créditos de pesquisa	Programa de Acesso a Pesquisadores
Illuminarty	Sim	Imagens de IA, regiões localizadas	REST	Sim, modelo provável	Limitado	Sim, classificação básica	Níveis mensais publicados
Modelos hospedados no Hugging Face	Sim (conta HF)	Depende do modelo escolhido	Inferência REST	Depende do modelo	Depende do modelo	Uso gratuito sem servidor, limitado	Por uso ou endpoint dedicado

Considere a precisão de cada opção como condicional. Nenhuma delas autentica uma imagem de forma conclusiva.

Como integrar uma API de detecção no seu backend

Um fluxo seguro evita bloquear usuários com base em uma única pontuação.

Fluxo recomendado

Usuário faz upload
        ↓
Backend armazena imagem temporariamente
        ↓
Backend chama API de detecção
        ↓
Pontuação é registrada
        ↓
Regra de decisão:
  - baixo risco: aprovar
  - médio risco: revisão humana
  - alto risco: bloquear ou exigir verificação adicional
        ↓
Resultado é salvo para auditoria

Exemplo de decisão no backend

function decideAction({ aiScore, deepfakeScore }) {
  if (deepfakeScore >= 0.85) {
    return {
      action: "manual_review",
      reason: "high_deepfake_risk"
    };
  }

  if (aiScore >= 0.90) {
    return {
      action: "manual_review",
      reason: "high_ai_generation_risk"
    };
  }

  if (aiScore >= 0.60) {
    return {
      action: "soft_flag",
      reason: "medium_ai_generation_risk"
    };
  }

  return {
    action: "approve",
    reason: "low_risk"
  };
}

Campos úteis para salvar

{
  "image_id": "img_123",
  "provider": "sightengine",
  "ai_score": 0.74,
  "deepfake_score": 0.12,
  "generator_guess": "midjourney",
  "decision": "soft_flag",
  "latency_ms": 281,
  "created_at": "2026-06-08T10:30:00Z"
}

Esses registros ajudam a:

auditar decisões;
ajustar thresholds;
comparar fornecedores;
medir falsos positivos;
responder a contestações de usuários.

Conclusão

Detecção de imagem de IA é útil, mas não é mágica. Use como sinal dentro de um sistema maior, não como veredito final.

Para uma API geral com inscrição aberta e atribuição de gerador, comece com Sightengine ou Hive Moderation.
Para um endpoint síncrono simples que retorna tudo em uma única chamada, teste AI or Not.
Para deepfakes e manipulação de rosto, Reality Defender é o especialista e tem nível gratuito público.
O classificador DALL-E 3 da OpenAI é apenas para acesso de pesquisa; não planeje um produto em torno dele.
Illuminarty é uma opção econômica com detecção localizada.
Modelos hospedados no Hugging Face funcionam melhor para equipes que querem controle e aceitam gerenciar a engenharia.
Nenhuma API é conclusiva. Valide em seu próprio tráfego, projete para falsos positivos e envie pontuações limítrofes para revisão humana.

A forma mais confiável de escolher é testar. Conecte o endpoint de cada provedor ao Apidog, envie imagens reais, inspecione o JSON, meça a latência da sua região e compare os resultados lado a lado antes de escrever uma única linha de código de produção.