DEV Community

ANTÔNIO
ANTÔNIO

Posted on

Horaculo: Detectando Manipulação em Notícias Financeiras com IA"

Horaculo: Sistema de IA que Detecta Padrões Ocultos em Notícias Financeiras

Você já parou para pensar em quantas vezes a mídia escreve sobre a mesma coisa de forma completamente diferente? Ou como é possível que múltiplas fontes "independentes" chegarem ao mesmo consenso exatamente na mesma hora?

Eu construí um sistema que detecta isso automaticamente.

O Problema Real

Em mercados financeiros (ações, cripto, commodities), as narrativas são armas.

Quando você lê que "petróleo vai subir", precisa saber:

  • ✅ Isso é análise genuína?
  • ✅ Ou várias fontes estão coordenadas (manipulação)?
  • ✅ Qual fonte historicamente acertou mais?
  • ✅ Qual é o sentimento real do mercado?

Atualmente, você lê 10 artigos manualmente e faz uma análise intuitiva.

Horaculo automatiza isso.

A Solução: Análise Multi-Fonte com IA

NewsAPI (Reuters, Bloomberg, CNN, etc)
    ↓
Extração de Claims (NLP)
    ↓
Vetorização com Embeddings (HuggingFace)
    ↓
Motor C++ Otimizado (Cosine Similarity + AVX2)
    ↓
Detecção de Padrões (Clustering, Coordenação)
    ↓
Psicologia do Mercado (Medo, Euforia, Traps)
    ↓
JSON Estruturado + Sinais de Oportunidade
Enter fullscreen mode Exit fullscreen mode

Um Exemplo Real

Digamos que você faz a query: "petróleo"

Horaculo retorna:

{
  "verdict": {
    "winner_source": "Reuters",
    "intensity": 0.85,
    "entropy": 1.92
  },
  "eden_signal": {
    "detected": true,
    "source": "Reuters",
    "confidence": 0.92
  },
  "psychology": {
    "mood": "Fear",
    "is_trap": true,
    "coordination_score": 0.72
  },
  "hard_data": {
    "percentages": ["+12.5%", "-8.3%"],
    "monetary": ["$142.50", "$8.2B"]
  }
}
Enter fullscreen mode Exit fullscreen mode

O que isso significa:

Campo Tradução
winner_source: Reuters Reuters é a narrativa mais consensual
intensity: 0.85 Conflito alto entre fontes (divergência narrativa)
entropy: 1.92 Caos narrativo (informação incompleta no mercado)
eden_signal: true OPORTUNIDADE DETECTADA (fonte confiável + baixo conflito = situação incomum)
is_trap: true Padrão suspeito de "armadilha de varejo"
coordination: 0.72 Múltiplas fontes estão narrativamente coordenadas (possível manipulação)

Arquitetura Técnica (Sem Complexidade Desnecessária)

Backend: Python + C++

Por que C++?

Porque calcular cosine similarity em 100.000+ embeddings precisa de performance:

  • INT8 Quantização — reduz tamanho 4x (1.3MB → 325KB)
  • AVX2 SIMD — paraleliza operações bit a bit
  • PyBind11 — integração zero-overhead com Python

Resultado: 1.4s por análise vs 12s se fosse pure Python.

Frontend: React + Tailwind

5 telas interativas:

  1. Portal — Busca e logs em tempo real
  2. Radar — Scatter plot de sentimento vs credibilidade
  3. Intelligence — Clusters de narrativas
  4. Stress — Psicologia do mercado
  5. Crypto Satellite — Análise isolada de blockchain

Memória: SQLite + Postgres

Horaculo memoriza histórico de fontes:

# Cada fonte tem um perfil:
{
  "source": "Reuters",
  "total_scans": 342,
  "consensus_hits": 289,  # Vezes que acertou
  "credibility": 0.85
}
Enter fullscreen mode Exit fullscreen mode

Na próxima análise, fontes com histórico melhor ganham peso.

Como Usar (Pronto para Rodar)

Opção 1: Docker (Recomendado)

git clone https://github.com/seu-usuario/horaculo.git
cd horaculo
docker-compose up
python python/run_horaculo.py --newsapi_key YOUR_KEY --query "oil"
Enter fullscreen mode Exit fullscreen mode

Opção 2: Local

pip install -r requirements.txt
python setup.py build_ext --inplace
export NEWSAPI_KEY="xxx"
python python/run_horaculo.py --query "Apple stock"
Enter fullscreen mode Exit fullscreen mode

Casos de Uso

1️⃣ Trader Quantitativo

Integra Horaculo na pipeline e automatiza sinais:

response = run_query("bitcoin volatility")
if response["eden_signal"]["detected"]:
    execute_trade(response["sentiment"])
Enter fullscreen mode Exit fullscreen mode

2️⃣ Analista de Risco

Detecta quando "narrativas suspeitas" emergem no seu mercado de interesse:

# Monitora coordenação anormal
if response["psychology"]["coordination"] > 0.8:
    alert("Possível manipulação detectada")
Enter fullscreen mode Exit fullscreen mode

3️⃣ Jornalista / Fact-Checker

Valida se múltiplas fontes estão alinhadas:

# Entropy alto = caos narrativo = notícia não é clara
if response["verdict"]["entropy"] > 1.8:
    print("Informação incompleta. Espere mais fontes.")
Enter fullscreen mode Exit fullscreen mode

4️⃣ Pesquisador de IA

Estuda emergência de padrões em dados não estruturados.

Tecnicamente Falando

O Que Torna Isso Diferente

Solução Tradicional:

  • Você lê 10 artigos manualmente
  • Faz uma análise intuitiva
  • Risco de bias pessoal
  • Demora ~15 minutos

Horaculo:

  • Analisa 50-100 fontes automaticamente
  • Remove bias intuitivo (tudo é matemática)
  • Memória de histórico de fontes
  • Completa em ~1.4 segundos

Performance Comprovada

  • Latência: 1.4s (10 fontes)
  • Throughput: ~100 queries/min
  • Memória: ~150MB (SQLite)
  • CPU: Otimizado com AVX2

Open Source

Código completo disponível em GitHub:

horaculo/
├── python/          # Backend (2.682 linhas)
├── src/core.cpp     # Motor C++ otimizado
├── app/             # Frontend React
└── docker-compose   # Deploy pronto
Enter fullscreen mode Exit fullscreen mode

Licença: MIT (use em qualquer projeto)

Próximos Passos

Horaculo está em constante evolução:

  • [ ] Suporte a múltiplas criptos (SOL, BTC, ETH)
  • [ ] ML retraining automático
  • [ ] WebSocket para streaming real-time
  • [ ] Mobile app (React Native)
  • [ ] Integração com trading bots

Conclusão

Horaculo resolve um problema real:

Como detectar padrões genuínos de oportunidade em meio ao ruído de narrativas financeiras?

Resposta: Análise multi-fonte + história de credibilidade + psicologia de mercado + detecção de coordenação.

Se você trabalha com mercados financeiros, análise de notícias ou AI em geral, você pode:

  • ✅ Clonar o código
  • ✅ Rodar localmente
  • ✅ Integrar na sua aplicação
  • ✅ Contribuir melhorias

GitHub: horaculo

Documentação: docs/README.md

Dúvidas? Comente abaixo. Vou responder todas.


Horaculo: Quando múltiplas perspectivas revelam uma verdade.

Top comments (0)