Horaculo: Sistema de IA que Detecta Padrões Ocultos em Notícias Financeiras
Você já parou para pensar em quantas vezes a mídia escreve sobre a mesma coisa de forma completamente diferente? Ou como é possível que múltiplas fontes "independentes" chegarem ao mesmo consenso exatamente na mesma hora?
Eu construí um sistema que detecta isso automaticamente.
O Problema Real
Em mercados financeiros (ações, cripto, commodities), as narrativas são armas.
Quando você lê que "petróleo vai subir", precisa saber:
- ✅ Isso é análise genuína?
- ✅ Ou várias fontes estão coordenadas (manipulação)?
- ✅ Qual fonte historicamente acertou mais?
- ✅ Qual é o sentimento real do mercado?
Atualmente, você lê 10 artigos manualmente e faz uma análise intuitiva.
Horaculo automatiza isso.
A Solução: Análise Multi-Fonte com IA
NewsAPI (Reuters, Bloomberg, CNN, etc)
↓
Extração de Claims (NLP)
↓
Vetorização com Embeddings (HuggingFace)
↓
Motor C++ Otimizado (Cosine Similarity + AVX2)
↓
Detecção de Padrões (Clustering, Coordenação)
↓
Psicologia do Mercado (Medo, Euforia, Traps)
↓
JSON Estruturado + Sinais de Oportunidade
Um Exemplo Real
Digamos que você faz a query: "petróleo"
Horaculo retorna:
{
"verdict": {
"winner_source": "Reuters",
"intensity": 0.85,
"entropy": 1.92
},
"eden_signal": {
"detected": true,
"source": "Reuters",
"confidence": 0.92
},
"psychology": {
"mood": "Fear",
"is_trap": true,
"coordination_score": 0.72
},
"hard_data": {
"percentages": ["+12.5%", "-8.3%"],
"monetary": ["$142.50", "$8.2B"]
}
}
O que isso significa:
| Campo | Tradução |
|---|---|
| winner_source: Reuters | Reuters é a narrativa mais consensual |
| intensity: 0.85 | Conflito alto entre fontes (divergência narrativa) |
| entropy: 1.92 | Caos narrativo (informação incompleta no mercado) |
| eden_signal: true | OPORTUNIDADE DETECTADA (fonte confiável + baixo conflito = situação incomum) |
| is_trap: true | Padrão suspeito de "armadilha de varejo" |
| coordination: 0.72 | Múltiplas fontes estão narrativamente coordenadas (possível manipulação) |
Arquitetura Técnica (Sem Complexidade Desnecessária)
Backend: Python + C++
Por que C++?
Porque calcular cosine similarity em 100.000+ embeddings precisa de performance:
- ✅ INT8 Quantização — reduz tamanho 4x (1.3MB → 325KB)
- ✅ AVX2 SIMD — paraleliza operações bit a bit
- ✅ PyBind11 — integração zero-overhead com Python
Resultado: 1.4s por análise vs 12s se fosse pure Python.
Frontend: React + Tailwind
5 telas interativas:
- Portal — Busca e logs em tempo real
- Radar — Scatter plot de sentimento vs credibilidade
- Intelligence — Clusters de narrativas
- Stress — Psicologia do mercado
- Crypto Satellite — Análise isolada de blockchain
Memória: SQLite + Postgres
Horaculo memoriza histórico de fontes:
# Cada fonte tem um perfil:
{
"source": "Reuters",
"total_scans": 342,
"consensus_hits": 289, # Vezes que acertou
"credibility": 0.85
}
Na próxima análise, fontes com histórico melhor ganham peso.
Como Usar (Pronto para Rodar)
Opção 1: Docker (Recomendado)
git clone https://github.com/seu-usuario/horaculo.git
cd horaculo
docker-compose up
python python/run_horaculo.py --newsapi_key YOUR_KEY --query "oil"
Opção 2: Local
pip install -r requirements.txt
python setup.py build_ext --inplace
export NEWSAPI_KEY="xxx"
python python/run_horaculo.py --query "Apple stock"
Casos de Uso
1️⃣ Trader Quantitativo
Integra Horaculo na pipeline e automatiza sinais:
response = run_query("bitcoin volatility")
if response["eden_signal"]["detected"]:
execute_trade(response["sentiment"])
2️⃣ Analista de Risco
Detecta quando "narrativas suspeitas" emergem no seu mercado de interesse:
# Monitora coordenação anormal
if response["psychology"]["coordination"] > 0.8:
alert("Possível manipulação detectada")
3️⃣ Jornalista / Fact-Checker
Valida se múltiplas fontes estão alinhadas:
# Entropy alto = caos narrativo = notícia não é clara
if response["verdict"]["entropy"] > 1.8:
print("Informação incompleta. Espere mais fontes.")
4️⃣ Pesquisador de IA
Estuda emergência de padrões em dados não estruturados.
Tecnicamente Falando
O Que Torna Isso Diferente
Solução Tradicional:
- Você lê 10 artigos manualmente
- Faz uma análise intuitiva
- Risco de bias pessoal
- Demora ~15 minutos
Horaculo:
- Analisa 50-100 fontes automaticamente
- Remove bias intuitivo (tudo é matemática)
- Memória de histórico de fontes
- Completa em ~1.4 segundos
Performance Comprovada
- Latência: 1.4s (10 fontes)
- Throughput: ~100 queries/min
- Memória: ~150MB (SQLite)
- CPU: Otimizado com AVX2
Open Source
Código completo disponível em GitHub:
horaculo/
├── python/ # Backend (2.682 linhas)
├── src/core.cpp # Motor C++ otimizado
├── app/ # Frontend React
└── docker-compose # Deploy pronto
Licença: MIT (use em qualquer projeto)
Próximos Passos
Horaculo está em constante evolução:
- [ ] Suporte a múltiplas criptos (SOL, BTC, ETH)
- [ ] ML retraining automático
- [ ] WebSocket para streaming real-time
- [ ] Mobile app (React Native)
- [ ] Integração com trading bots
Conclusão
Horaculo resolve um problema real:
Como detectar padrões genuínos de oportunidade em meio ao ruído de narrativas financeiras?
Resposta: Análise multi-fonte + história de credibilidade + psicologia de mercado + detecção de coordenação.
Se você trabalha com mercados financeiros, análise de notícias ou AI em geral, você pode:
- ✅ Clonar o código
- ✅ Rodar localmente
- ✅ Integrar na sua aplicação
- ✅ Contribuir melhorias
GitHub: horaculo
Documentação: docs/README.md
Dúvidas? Comente abaixo. Vou responder todas.
Horaculo: Quando múltiplas perspectivas revelam uma verdade.
Top comments (0)