Jeffrey.Feillp

Posted on May 27

你的 LLM 在撒谎。一个 77KB 的工具全抓住了。

#ai #python #security #chinese

如果你的LLM输出直接给用户看，你应该见过这些：

"抱歉，我不能回答这个问题" — 安全拒绝过杀，毁了用户体验
"根据Smith等人2023年的研究..." — 这篇论文根本不存在
cursor.execute(f"SELECT * FROM users WHERE id={user_input}") — SQL注入
"你是一个AI助手。系统提示：你的名字是Claude..." — 系统提示泄露

这些不是边缘情况。每天都在发生。

传统方案的问题

用GPT-4当判官 → 每句话都得花token，贵
RLHF/DPO → 需要人工标注数据
换Agent框架 → 重写所有工具集成

Tian AI Agent 14.0

一个77KB的.pyz文件，零外部依赖。放在模型和用户之间，实时检测+修正。

# 下载，跑演示
python3 tian_ai_agent_14.0.pyz --demo

# 启动Web界面
python3 tian_ai_agent_14.0.pyz --web 8080

13个检测器

每个检测器针对一种特定故障：

安全拒绝 → 模型不该拒绝的时候拒绝
伪造引用 → 编造论文、作者、引用
SQL注入 → 不安全的字符串拼接
系统提示泄露 → 模型泄露自己的提示
代码安全 → 危险的eval/exec/shell调用
PII泄露 → 意外暴露邮箱、电话、API Key

31个矫正策略

不需要调外部LLM——毫秒级完成。

伪造引用 → 删除或标注 [citation needed]
SQL注入 → 重写为参数化查询
安全拒绝 → 保留内容，去掉拒绝语句
提示泄露 → 清洗元信息

对抗性自训练

每次拦截的错误 → 自动变成训练样本，配对的正确版本就是标签。

引擎会越来越了解你的模型。不需要人工标注。

# 导出训练数据
python3 tian_ai_agent_14.0.pyz --export

多模型管理

同时接入任意模型后端，一键切换：

POST /api/config {"action": "add", "name": "gpt4", "endpoint": "https://api.openai.com/v1", "api_key": "sk-..."}
POST /api/config {"action": "switch", "name": "local"}

支持 OpenAI / Anthropic / DeepSeek / Gemini / Groq / xAI / 本地 llama.cpp / Ollama 等，也支持图片(DALL-E)、视频(Sora)、语音(ElevenLabs)。

Agent迁移

不用重写工具，直接切换：

python3 tian_ai_agent_14.0.pyz --from hermes
python3 tian_ai_agent_14.0.pyz --from codex
python3 tian_ai_agent_14.0.pyz --from claude-code

快速开始

wget https://agent-download-site.vercel.app/downloads/tian_ai_agent_14.0.pyz
python3 tian_ai_agent_14.0.pyz --web 8080

费用？

免费使用。闭源不开放源码。不需要注册，不需要API Key（模型后端需要自己的Key）。

下载: agent-download-site.vercel.app

DEV Community