ANTÔNIO

Posted on Feb 6

Horaculo: Detectando Manipulação em Notícias Financeiras com IA"

#ai #machinelearning #nlp #cpp

Horaculo: Sistema de IA que Detecta Padrões Ocultos em Notícias Financeiras

Você já parou para pensar em quantas vezes a mídia escreve sobre a mesma coisa de forma completamente diferente? Ou como é possível que múltiplas fontes "independentes" chegarem ao mesmo consenso exatamente na mesma hora?

Eu construí um sistema que detecta isso automaticamente.

O Problema Real

Em mercados financeiros (ações, cripto, commodities), as narrativas são armas.

Quando você lê que "petróleo vai subir", precisa saber:

✅ Isso é análise genuína?
✅ Ou várias fontes estão coordenadas (manipulação)?
✅ Qual fonte historicamente acertou mais?
✅ Qual é o sentimento real do mercado?

Atualmente, você lê 10 artigos manualmente e faz uma análise intuitiva.

Horaculo automatiza isso.

A Solução: Análise Multi-Fonte com IA

NewsAPI (Reuters, Bloomberg, CNN, etc)
    ↓
Extração de Claims (NLP)
    ↓
Vetorização com Embeddings (HuggingFace)
    ↓
Motor C++ Otimizado (Cosine Similarity + AVX2)
    ↓
Detecção de Padrões (Clustering, Coordenação)
    ↓
Psicologia do Mercado (Medo, Euforia, Traps)
    ↓
JSON Estruturado + Sinais de Oportunidade

Um Exemplo Real

Digamos que você faz a query: "petróleo"

Horaculo retorna:

{
  "verdict": {
    "winner_source": "Reuters",
    "intensity": 0.85,
    "entropy": 1.92
  },
  "eden_signal": {
    "detected": true,
    "source": "Reuters",
    "confidence": 0.92
  },
  "psychology": {
    "mood": "Fear",
    "is_trap": true,
    "coordination_score": 0.72
  },
  "hard_data": {
    "percentages": ["+12.5%", "-8.3%"],
    "monetary": ["$142.50", "$8.2B"]
  }
}

O que isso significa:

Campo	Tradução
winner_source: Reuters	Reuters é a narrativa mais consensual
intensity: 0.85	Conflito alto entre fontes (divergência narrativa)
entropy: 1.92	Caos narrativo (informação incompleta no mercado)
eden_signal: true	OPORTUNIDADE DETECTADA (fonte confiável + baixo conflito = situação incomum)
is_trap: true	Padrão suspeito de "armadilha de varejo"
coordination: 0.72	Múltiplas fontes estão narrativamente coordenadas (possível manipulação)

Arquitetura Técnica (Sem Complexidade Desnecessária)

Backend: Python + C++

Por que C++?

Porque calcular cosine similarity em 100.000+ embeddings precisa de performance:

✅ INT8 Quantização — reduz tamanho 4x (1.3MB → 325KB)
✅ AVX2 SIMD — paraleliza operações bit a bit
✅ PyBind11 — integração zero-overhead com Python

Resultado: 1.4s por análise vs 12s se fosse pure Python.

Frontend: React + Tailwind

5 telas interativas:

Portal — Busca e logs em tempo real
Radar — Scatter plot de sentimento vs credibilidade
Intelligence — Clusters de narrativas
Stress — Psicologia do mercado
Crypto Satellite — Análise isolada de blockchain

Memória: SQLite + Postgres

Horaculo memoriza histórico de fontes:

# Cada fonte tem um perfil:
{
  "source": "Reuters",
  "total_scans": 342,
  "consensus_hits": 289,  # Vezes que acertou
  "credibility": 0.85
}

Na próxima análise, fontes com histórico melhor ganham peso.

Como Usar (Pronto para Rodar)

Opção 1: Docker (Recomendado)

git clone https://github.com/seu-usuario/horaculo.git
cd horaculo
docker-compose up
python python/run_horaculo.py --newsapi_key YOUR_KEY --query "oil"

Opção 2: Local

pip install -r requirements.txt
python setup.py build_ext --inplace
export NEWSAPI_KEY="xxx"
python python/run_horaculo.py --query "Apple stock"

Casos de Uso

1️⃣ Trader Quantitativo

Integra Horaculo na pipeline e automatiza sinais:

response = run_query("bitcoin volatility")
if response["eden_signal"]["detected"]:
    execute_trade(response["sentiment"])

2️⃣ Analista de Risco

Detecta quando "narrativas suspeitas" emergem no seu mercado de interesse:

# Monitora coordenação anormal
if response["psychology"]["coordination"] > 0.8:
    alert("Possível manipulação detectada")

3️⃣ Jornalista / Fact-Checker

Valida se múltiplas fontes estão alinhadas:

# Entropy alto = caos narrativo = notícia não é clara
if response["verdict"]["entropy"] > 1.8:
    print("Informação incompleta. Espere mais fontes.")

4️⃣ Pesquisador de IA

Estuda emergência de padrões em dados não estruturados.

Tecnicamente Falando

O Que Torna Isso Diferente

Solução Tradicional:

Você lê 10 artigos manualmente
Faz uma análise intuitiva
Risco de bias pessoal
Demora ~15 minutos

Horaculo:

Analisa 50-100 fontes automaticamente
Remove bias intuitivo (tudo é matemática)
Memória de histórico de fontes
Completa em ~1.4 segundos

Performance Comprovada

Latência: 1.4s (10 fontes)
Throughput: ~100 queries/min
Memória: ~150MB (SQLite)
CPU: Otimizado com AVX2

Open Source

Código completo disponível em GitHub:

horaculo/
├── python/          # Backend (2.682 linhas)
├── src/core.cpp     # Motor C++ otimizado
├── app/             # Frontend React
└── docker-compose   # Deploy pronto

Licença: MIT (use em qualquer projeto)

Próximos Passos

Horaculo está em constante evolução:

[ ] Suporte a múltiplas criptos (SOL, BTC, ETH)
[ ] ML retraining automático
[ ] WebSocket para streaming real-time
[ ] Mobile app (React Native)
[ ] Integração com trading bots

Conclusão

Horaculo resolve um problema real:

Como detectar padrões genuínos de oportunidade em meio ao ruído de narrativas financeiras?

Resposta: Análise multi-fonte + história de credibilidade + psicologia de mercado + detecção de coordenação.

Se você trabalha com mercados financeiros, análise de notícias ou AI em geral, você pode:

✅ Clonar o código
✅ Rodar localmente
✅ Integrar na sua aplicação
✅ Contribuir melhorias

GitHub: horaculo

Documentação: docs/README.md

Dúvidas? Comente abaixo. Vou responder todas.

Horaculo: Quando múltiplas perspectivas revelam uma verdade.

DEV Community