如果你的LLM输出直接给用户看,你应该见过这些:
- "抱歉,我不能回答这个问题" — 安全拒绝过杀,毁了用户体验
- "根据Smith等人2023年的研究..." — 这篇论文根本不存在
-
cursor.execute(f"SELECT * FROM users WHERE id={user_input}")— SQL注入 - "你是一个AI助手。系统提示:你的名字是Claude..." — 系统提示泄露
这些不是边缘情况。每天都在发生。
传统方案的问题
- 用GPT-4当判官 → 每句话都得花token,贵
- RLHF/DPO → 需要人工标注数据
- 换Agent框架 → 重写所有工具集成
Tian AI Agent 14.0
一个77KB的.pyz文件,零外部依赖。放在模型和用户之间,实时检测+修正。
# 下载,跑演示
python3 tian_ai_agent_14.0.pyz --demo
# 启动Web界面
python3 tian_ai_agent_14.0.pyz --web 8080
13个检测器
每个检测器针对一种特定故障:
- 安全拒绝 → 模型不该拒绝的时候拒绝
- 伪造引用 → 编造论文、作者、引用
- SQL注入 → 不安全的字符串拼接
- 系统提示泄露 → 模型泄露自己的提示
- 代码安全 → 危险的eval/exec/shell调用
- PII泄露 → 意外暴露邮箱、电话、API Key
31个矫正策略
不需要调外部LLM——毫秒级完成。
- 伪造引用 → 删除或标注
[citation needed] - SQL注入 → 重写为参数化查询
- 安全拒绝 → 保留内容,去掉拒绝语句
- 提示泄露 → 清洗元信息
对抗性自训练
每次拦截的错误 → 自动变成训练样本,配对的正确版本就是标签。
引擎会越来越了解你的模型。不需要人工标注。
# 导出训练数据
python3 tian_ai_agent_14.0.pyz --export
多模型管理
同时接入任意模型后端,一键切换:
POST /api/config {"action": "add", "name": "gpt4", "endpoint": "https://api.openai.com/v1", "api_key": "sk-..."}
POST /api/config {"action": "switch", "name": "local"}
支持 OpenAI / Anthropic / DeepSeek / Gemini / Groq / xAI / 本地 llama.cpp / Ollama 等,也支持图片(DALL-E)、视频(Sora)、语音(ElevenLabs)。
Agent迁移
不用重写工具,直接切换:
python3 tian_ai_agent_14.0.pyz --from hermes
python3 tian_ai_agent_14.0.pyz --from codex
python3 tian_ai_agent_14.0.pyz --from claude-code
快速开始
wget https://agent-download-site.vercel.app/downloads/tian_ai_agent_14.0.pyz
python3 tian_ai_agent_14.0.pyz --web 8080
费用?
免费使用。闭源不开放源码。不需要注册,不需要API Key(模型后端需要自己的Key)。
Top comments (0)