Stavo costruendo applicazioni AI sulle API di Anthropic e continuavo ad avere lo stesso problema: i costi erano più alti del previsto e non capivo dove andavano i token.
La maggior parte dei tool di monitoring ti dice quanto hai già speso. Io volevo qualcosa che mi dicesse cosa stavo per sprecare — prima di inviare la richiesta.
Ho costruito token-saver.
Cosa fa
- Static Analyzer — analizza il codice Python prima che giri tsave scan chatbot.py Trova pattern come chiamate API dentro loop, system prompt non cachati, documenti interi passati ad ogni richiesta, modelli costosi usati per task semplici. Senza API key. Funziona come un linter ma per i token.
- Conteggio token reale — usa l'API ufficiale Anthropic count_tokens, non tiktoken di OpenAI (che sottostima i token di Claude del 15-20%)
- Compressore semantico — non tronca semplicemente. Valuta ogni messaggio in base al task corrente e rimuove solo l'irrilevante. Risultato: 67% di riduzione token su conversazioni reali.
- Tracking utilizzo — ogni chiamata tracciata, proiezioni mensili incluse.
Benchmark reali
Su 1.000 richieste al giorno con Sonnet 4.6: risparmio stimato $200-$400 al mese.
Gira completamente in locale. I tuoi prompt non passano da nessun server esterno — vanno solo ad Anthropic. Per applicazioni in sanità e security, questo non è un dettaglio.
70 test verdi. Licenza MIT. Made in Italy.
👉 github.com/remo12262/token-saver
📌 TOPICS DA AGGIUNGERE SU GITHUB
Vai su github.com/remo12262/token-saver → ingranaggio ⚙️ accanto a "About" → aggiungi questi:
Top comments (0)