DEV Community

Jeffrey.Feillp
Jeffrey.Feillp

Posted on

你的 LLM 在撒谎。一个 77KB 的工具全抓住了。

如果你的LLM输出直接给用户看,你应该见过这些:

  • "抱歉,我不能回答这个问题" — 安全拒绝过杀,毁了用户体验
  • "根据Smith等人2023年的研究..." — 这篇论文根本不存在
  • cursor.execute(f"SELECT * FROM users WHERE id={user_input}") — SQL注入
  • "你是一个AI助手。系统提示:你的名字是Claude..." — 系统提示泄露

这些不是边缘情况。每天都在发生。

传统方案的问题

  • 用GPT-4当判官 → 每句话都得花token,贵
  • RLHF/DPO → 需要人工标注数据
  • 换Agent框架 → 重写所有工具集成

Tian AI Agent 14.0

一个77KB的.pyz文件,零外部依赖。放在模型和用户之间,实时检测+修正。

# 下载,跑演示
python3 tian_ai_agent_14.0.pyz --demo

# 启动Web界面
python3 tian_ai_agent_14.0.pyz --web 8080
Enter fullscreen mode Exit fullscreen mode

13个检测器

每个检测器针对一种特定故障:

  • 安全拒绝 → 模型不该拒绝的时候拒绝
  • 伪造引用 → 编造论文、作者、引用
  • SQL注入 → 不安全的字符串拼接
  • 系统提示泄露 → 模型泄露自己的提示
  • 代码安全 → 危险的eval/exec/shell调用
  • PII泄露 → 意外暴露邮箱、电话、API Key

31个矫正策略

不需要调外部LLM——毫秒级完成。

  • 伪造引用 → 删除或标注 [citation needed]
  • SQL注入 → 重写为参数化查询
  • 安全拒绝 → 保留内容,去掉拒绝语句
  • 提示泄露 → 清洗元信息

对抗性自训练

每次拦截的错误 → 自动变成训练样本,配对的正确版本就是标签。

引擎会越来越了解你的模型。不需要人工标注。

# 导出训练数据
python3 tian_ai_agent_14.0.pyz --export
Enter fullscreen mode Exit fullscreen mode

多模型管理

同时接入任意模型后端,一键切换:

POST /api/config {"action": "add", "name": "gpt4", "endpoint": "https://api.openai.com/v1", "api_key": "sk-..."}
POST /api/config {"action": "switch", "name": "local"}
Enter fullscreen mode Exit fullscreen mode

支持 OpenAI / Anthropic / DeepSeek / Gemini / Groq / xAI / 本地 llama.cpp / Ollama 等,也支持图片(DALL-E)、视频(Sora)、语音(ElevenLabs)。

Agent迁移

不用重写工具,直接切换:

python3 tian_ai_agent_14.0.pyz --from hermes
python3 tian_ai_agent_14.0.pyz --from codex
python3 tian_ai_agent_14.0.pyz --from claude-code
Enter fullscreen mode Exit fullscreen mode

快速开始

wget https://agent-download-site.vercel.app/downloads/tian_ai_agent_14.0.pyz
python3 tian_ai_agent_14.0.pyz --web 8080
Enter fullscreen mode Exit fullscreen mode

费用?

免费使用。闭源不开放源码。不需要注册,不需要API Key(模型后端需要自己的Key)。


下载: agent-download-site.vercel.app

Top comments (0)