大多数开发者把 gptme 当成一个「增强版命令行」——输入指令,生成代码,结束。但这个在 GitHub 上拥有 4,313 Stars 的开源项目,真正强大的功能藏在官方文档的角落里,几乎没人注意到。
gptme 是一个运行在终端里的 AI Agent,支持本地执行、无需云端 API。它能写代码、操作终端、浏览网页、处理图片、控制桌面 GUI。但更厉害的是它的插件系统、Subagent 并行执行、MCP 集成和代码分析能力——这些功能让终端变成了一个真正的 AI 工作站。
以下是 5 个大多数人完全不知道的隐藏用法。
隐藏用法 #1:Subagent 并行执行模式
大多数人的用法: 把 gptme 当成单线程助手——一个任务执行完,再执行下一个。
隐藏技巧: gptme 支持 Subagent 子代理系统,能在同一个对话中启动多个并行工作的 AI Agent。用 /subagent 命令触发:
# 在 gptme 对话中启动子代理(后台并行执行):
# /subagent "搜索 2026 年最火的 AI 编程工具,保存到 research.md"
# 这个任务在后台运行,你同时可以继续其他工作
# 复杂工作流可以链式调用多个子代理:
# /subagent "运行 ./data 文件夹的数据验证检查"
# /subagent "根据 ./src 变更更新 API 文档"
# 两个同时运行,完成后结果自动合并
Subagent 系统从 v0.29.0 版本引入,支持独立规划的执行上下文。每个子代理维护自己的对话轨迹,完成后报告结果。可以把它理解成从同一个终端窗口启动多个 AI 员工同时工作。
效果: 同时运行 3-5 个 Agent 处理项目不同方面——一个搜索网页,一个编写测试,一个检查代码质量,全部在一个终端窗口里完成。
数据来源: gptme GitHub 4,313 Stars(2026-05-29 直接 API 验证);Subagent planner mode 在 v0.29.0(2025-10)引入,验证自 GitHub releases 页面。
隐藏用法 #2:Lessons 系统——团队最佳实践自动注入
大多数人的用法: 把 gptme 当成空白画布——每次对话都从零开始,没有任何项目上下文。
隐藏技巧: gptme 的 Lessons 系统会根据对话中的关键词、工具和模式自动注入上下文指导。写一次规则,它就会在相关场景自动触发:
# 文件位置:~/.config/gptme/lessons/my-project-standards.md
# Lesson 格式(Anthropic 兼容):
# ---
# trigger_keywords: ["api", "endpoint", "route"]
# tools: ["shell", "python"]
# ---
# 在本项目中处理 API endpoints 时:
# 1. 始终使用 FastAPI 并添加类型提示
# 2. 使用 Pydantic 模型处理请求/响应
# 3. 包含 OpenAPI 文档字符串
# 4. 提交前运行:pytest tests/api/
# gptme 检测到 "api" 或 "endpoint" -> lesson 自动触发
# 无需每次手动引用规范
Lessons 存储在 ~/.config/gptme/lessons/ 目录下的 Markdown 文件中,通过关键词、工具或模式匹配触发。系统会区分交互模式和自主执行模式,Lessons 可以包含 shell 命令、代码模板和工作流步骤。
效果: 新团队成员自动获得项目特定的指导——无需阅读入职文档,无需记忆命令。Agent 从第一天就知道你的代码库规范。
数据来源: gptme GitHub 4,313 Stars;Lessons 系统记录于 gptme.org/docs/lessons 官方文档。
隐藏用法 #3:MCP Server 集成——连接任何 MCP 工具
大多数人的用法: 只使用 gptme 内置工具,不探索 MCP 生态。
隐藏技巧: gptme 从 v0.28.0 起支持 MCP(Model Context Protocol)。这意味着任何 MCP Server 都可以作为 gptme 的工具接入——文件系统、Web 搜索、数据库、Slack、GitHub,任何有 MCP 实现的工具都可以:
# 安装一个 MCP server,例如 filesystem MCP
pip install mcp-server-filesystem
# 在 gptme.toml 中配置(通常位于 ~/.config/gptme/gptme.toml)
[plugins]
paths = ["~/.config/gptme/plugins"]
# 或者使用 MCP discovery 自动工具加载
# gptme 根据对话上下文自动发现并加载相关 MCP tools
# 然后在 gptme 对话中:
# "用 filesystem MCP 读取我的项目文档"
# "用 Tavily MCP 搜索网页"
# "用 Postgres MCP 查询我的数据库"
# MCP tools 与 gptme 原生工具一起出现
MCP 发现和动态加载在 v0.29.0 引入,带有 token 感知功能——gptme 只加载对话相关的 MCP 工具,保持 token 使用高效。
效果: gptme 成为你整个 MCP 生态的统一接口——在同一个对话中组合本地文件系统 MCP、Tavily 网页搜索、Postgres 数据库、Slack 通知和自定义 MCP 服务器。
数据来源: gptme GitHub 4,313 Stars;MCP 支持在 v0.28.0(2025-08)引入,验证自 GitHub releases;MCP discovery 在 v0.29.0(2025-10)引入,验证自 README news 部分。
隐藏用法 #4:完整桌面 GUI 自动化(Computer Use)
大多数人的用法: 只用 gptme 处理终端任务——shell 命令、代码编写、文件编辑。从没想过用它控制 GUI 应用。
隐藏技巧: gptme 有一个 /computer 工具,能给 Agent 完全的桌面访问权限。这个功能在 v0.27 版本中与 Claude 3.7 Sonnet 集成一起重点推出,支持通过自然语言命令进行 GUI 自动化:
# 在启用了 computer 工具的 gptme 对话中:
# "打开 Chrome 搜索 'gptme terminal AI agent'"
# "点击第一个结果,等待页面加载,截一张图"
# "导航到 设置 -> 隐私 -> 清除浏览数据"
# "打开 VS Code,导航到我上次编辑的文件,做同样的修改"
# computer 工具底层使用 Playwright 进行浏览器自动化
# 对于本地 GUI 应用,使用平台特定的辅助功能 API
# 在 gptme.toml 中启用 computer 工具:
[tools]
computer = true
# Computer 工具支持:
# - GUI 应用启动和控制
# - 截图(整个桌面、特定窗口、区域)
# - 鼠标/键盘输入模拟
# - 通过 GUI 对话框的文件系统导航
效果: 自动化任何 GUI 工作流——端到端测试 Web 应用、配置桌面设置、从没有 CLI 接口的 GUI 工具中提取数据、用旁白 Agent 操作创建屏幕录制。
数据来源: gptme GitHub 4,313 Stars;computer use 功能在 v0.27 changelog 中提及(Claude 3.7 Sonnet、DeepSeek R1、Kokoro 本地 TTS)。
隐藏用法 #5:gptme-codegraph Tree-sitter MCP 代码分析工具
大多数人的用法: 把 gptme 用于简单的代码生成和编辑——要一个函数,给代码,结束。完全没利用它的代码图谱能力。
隐藏技巧: gptme-codegraph 插件(来自 gptme-contrib)提供 9 个 MCP 工具,基于 Tree-sitter AST 解析进行结构化代码理解:
# 安装 gptme-codegraph:
# pip install gptme-codegraph
# 在 gptme.toml plugins 列表中添加:
[plugins]
paths = ["~/.config/gptme/plugins"]
enabled = ["gptme-codegraph"]
# 可用的 MCP 工具(9 个):
# 1. codegraph_parse - 解析文件的 AST
# 2. codegraph_call_graph - 提取函数调用关系
# 3. codegraph_blast - 找出变更在代码库中的影响范围
# 4. codegraph_symbols - 提取所有符号(函数、类)
# 5. codegraph_refs - 查找符号的所有引用
# gptme 对话中的示例工作流:
# "解析 ./src/api/routes.py 并展示所有函数定义"
# "找出所有调用 authenticate() 函数的地方"
# "如果我重命名这个类,显示它的影响半径"
# "提取所有 API endpoints 及其 HTTP 方法"
codegraph 工具通过 MCP 集成,所以它们可以作为常规 gptme 工具通过自然语言访问。blast/影响分析对于大型重构特别强大——问「如果我改这个工具函数会破坏什么?」就能获得完整的 impact 报告。
效果: 几秒钟内导航复杂代码库——理解调用层次、查找符号引用、评估变更影响、提取 API 结构。就像在终端里有一个代码分析师。
数据来源: gptme GitHub 4,313 Stars;gptme-codegraph 来自 github.com/gptme/gptme-contrib,提供 9 个 MCP 代码分析工具。
总结:gptme 的 5 个隐藏技巧
- Subagent 并行执行模式 — 启动多个并行 AI Agent 同时处理不同任务
- Lessons 系统 — 通过关键词触发自动注入项目规范和最佳实践
- MCP Server 集成 — 将任何 MCP 工具连接为 gptme 工具(动态发现 + 加载)
- Computer Use(完整桌面控制) — 通过自然语言命令控制 GUI 应用
- gptme-codegraph MCP 工具 — 9 个 Tree-sitter AST 工具用于代码导航和影响分析
gptme 将你的终端变成多 Agent AI 工作站。它支持任意 LLM 提供商、本地优先、无约束——是最早的 Agent CLI 之一(2023 年),至今仍在活跃开发中。
相关文章:
你用 gptme 做过什么厉害的事?在评论区分享——我想听听你在自动化什么!
Top comments (0)