韩

Posted on May 29

这个 4,313 Stars 的终端 AI Agent，90% 的开发者不知道它还能做到这些 🔥

大多数开发者把 gptme 当成一个「增强版命令行」——输入指令，生成代码，结束。但这个在 GitHub 上拥有 4,313 Stars 的开源项目，真正强大的功能藏在官方文档的角落里，几乎没人注意到。

gptme 是一个运行在终端里的 AI Agent，支持本地执行、无需云端 API。它能写代码、操作终端、浏览网页、处理图片、控制桌面 GUI。但更厉害的是它的插件系统、Subagent 并行执行、MCP 集成和代码分析能力——这些功能让终端变成了一个真正的 AI 工作站。

以下是 5 个大多数人完全不知道的隐藏用法。

隐藏用法 #1：Subagent 并行执行模式

大多数人的用法： 把 gptme 当成单线程助手——一个任务执行完，再执行下一个。

隐藏技巧： gptme 支持 Subagent 子代理系统，能在同一个对话中启动多个并行工作的 AI Agent。用 /subagent 命令触发：

# 在 gptme 对话中启动子代理（后台并行执行）：
# /subagent "搜索 2026 年最火的 AI 编程工具，保存到 research.md"
# 这个任务在后台运行，你同时可以继续其他工作

# 复杂工作流可以链式调用多个子代理：
# /subagent "运行 ./data 文件夹的数据验证检查"
# /subagent "根据 ./src 变更更新 API 文档"
# 两个同时运行，完成后结果自动合并

Subagent 系统从 v0.29.0 版本引入，支持独立规划的执行上下文。每个子代理维护自己的对话轨迹，完成后报告结果。可以把它理解成从同一个终端窗口启动多个 AI 员工同时工作。

效果： 同时运行 3-5 个 Agent 处理项目不同方面——一个搜索网页，一个编写测试，一个检查代码质量，全部在一个终端窗口里完成。

数据来源： gptme GitHub 4,313 Stars（2026-05-29 直接 API 验证）；Subagent planner mode 在 v0.29.0（2025-10）引入，验证自 GitHub releases 页面。

隐藏用法 #2：Lessons 系统——团队最佳实践自动注入

大多数人的用法： 把 gptme 当成空白画布——每次对话都从零开始，没有任何项目上下文。

隐藏技巧： gptme 的 Lessons 系统会根据对话中的关键词、工具和模式自动注入上下文指导。写一次规则，它就会在相关场景自动触发：

# 文件位置：~/.config/gptme/lessons/my-project-standards.md
# Lesson 格式（Anthropic 兼容）：

# ---
# trigger_keywords: ["api", "endpoint", "route"]
# tools: ["shell", "python"]
# ---
# 在本项目中处理 API endpoints 时：
# 1. 始终使用 FastAPI 并添加类型提示
# 2. 使用 Pydantic 模型处理请求/响应
# 3. 包含 OpenAPI 文档字符串
# 4. 提交前运行：pytest tests/api/

# gptme 检测到 "api" 或 "endpoint" -> lesson 自动触发
# 无需每次手动引用规范

Lessons 存储在 ~/.config/gptme/lessons/ 目录下的 Markdown 文件中，通过关键词、工具或模式匹配触发。系统会区分交互模式和自主执行模式，Lessons 可以包含 shell 命令、代码模板和工作流步骤。

效果： 新团队成员自动获得项目特定的指导——无需阅读入职文档，无需记忆命令。Agent 从第一天就知道你的代码库规范。

数据来源： gptme GitHub 4,313 Stars；Lessons 系统记录于 gptme.org/docs/lessons 官方文档。

隐藏用法 #3：MCP Server 集成——连接任何 MCP 工具

大多数人的用法： 只使用 gptme 内置工具，不探索 MCP 生态。

隐藏技巧： gptme 从 v0.28.0 起支持 MCP（Model Context Protocol）。这意味着任何 MCP Server 都可以作为 gptme 的工具接入——文件系统、Web 搜索、数据库、Slack、GitHub，任何有 MCP 实现的工具都可以：

# 安装一个 MCP server，例如 filesystem MCP
pip install mcp-server-filesystem

# 在 gptme.toml 中配置（通常位于 ~/.config/gptme/gptme.toml）
[plugins]
paths = ["~/.config/gptme/plugins"]

# 或者使用 MCP discovery 自动工具加载
# gptme 根据对话上下文自动发现并加载相关 MCP tools

# 然后在 gptme 对话中：
# "用 filesystem MCP 读取我的项目文档"
# "用 Tavily MCP 搜索网页"
# "用 Postgres MCP 查询我的数据库"

# MCP tools 与 gptme 原生工具一起出现

MCP 发现和动态加载在 v0.29.0 引入，带有 token 感知功能——gptme 只加载对话相关的 MCP 工具，保持 token 使用高效。

效果： gptme 成为你整个 MCP 生态的统一接口——在同一个对话中组合本地文件系统 MCP、Tavily 网页搜索、Postgres 数据库、Slack 通知和自定义 MCP 服务器。

数据来源： gptme GitHub 4,313 Stars；MCP 支持在 v0.28.0（2025-08）引入，验证自 GitHub releases；MCP discovery 在 v0.29.0（2025-10）引入，验证自 README news 部分。

隐藏用法 #4：完整桌面 GUI 自动化（Computer Use）

大多数人的用法： 只用 gptme 处理终端任务——shell 命令、代码编写、文件编辑。从没想过用它控制 GUI 应用。

隐藏技巧： gptme 有一个 /computer 工具，能给 Agent 完全的桌面访问权限。这个功能在 v0.27 版本中与 Claude 3.7 Sonnet 集成一起重点推出，支持通过自然语言命令进行 GUI 自动化：

# 在启用了 computer 工具的 gptme 对话中：
# "打开 Chrome 搜索 'gptme terminal AI agent'"
# "点击第一个结果，等待页面加载，截一张图"
# "导航到 设置 -> 隐私 -> 清除浏览数据"
# "打开 VS Code，导航到我上次编辑的文件，做同样的修改"

# computer 工具底层使用 Playwright 进行浏览器自动化
# 对于本地 GUI 应用，使用平台特定的辅助功能 API

# 在 gptme.toml 中启用 computer 工具：
[tools]
computer = true

# Computer 工具支持：
# - GUI 应用启动和控制
# - 截图（整个桌面、特定窗口、区域）
# - 鼠标/键盘输入模拟
# - 通过 GUI 对话框的文件系统导航

效果： 自动化任何 GUI 工作流——端到端测试 Web 应用、配置桌面设置、从没有 CLI 接口的 GUI 工具中提取数据、用旁白 Agent 操作创建屏幕录制。

数据来源： gptme GitHub 4,313 Stars；computer use 功能在 v0.27 changelog 中提及（Claude 3.7 Sonnet、DeepSeek R1、Kokoro 本地 TTS）。

隐藏用法 #5：gptme-codegraph Tree-sitter MCP 代码分析工具

大多数人的用法： 把 gptme 用于简单的代码生成和编辑——要一个函数，给代码，结束。完全没利用它的代码图谱能力。

隐藏技巧： gptme-codegraph 插件（来自 gptme-contrib）提供 9 个 MCP 工具，基于 Tree-sitter AST 解析进行结构化代码理解：

# 安装 gptme-codegraph：
# pip install gptme-codegraph
# 在 gptme.toml plugins 列表中添加：

[plugins]
paths = ["~/.config/gptme/plugins"]
enabled = ["gptme-codegraph"]

# 可用的 MCP 工具（9 个）：
# 1. codegraph_parse     - 解析文件的 AST
# 2. codegraph_call_graph - 提取函数调用关系
# 3. codegraph_blast     - 找出变更在代码库中的影响范围
# 4. codegraph_symbols   - 提取所有符号（函数、类）
# 5. codegraph_refs      - 查找符号的所有引用

# gptme 对话中的示例工作流：
# "解析 ./src/api/routes.py 并展示所有函数定义"
# "找出所有调用 authenticate() 函数的地方"
# "如果我重命名这个类，显示它的影响半径"
# "提取所有 API endpoints 及其 HTTP 方法"

codegraph 工具通过 MCP 集成，所以它们可以作为常规 gptme 工具通过自然语言访问。blast/影响分析对于大型重构特别强大——问「如果我改这个工具函数会破坏什么？」就能获得完整的 impact 报告。

效果： 几秒钟内导航复杂代码库——理解调用层次、查找符号引用、评估变更影响、提取 API 结构。就像在终端里有一个代码分析师。

数据来源： gptme GitHub 4,313 Stars；gptme-codegraph 来自 github.com/gptme/gptme-contrib，提供 9 个 MCP 代码分析工具。

总结：gptme 的 5 个隐藏技巧

Subagent 并行执行模式 — 启动多个并行 AI Agent 同时处理不同任务
Lessons 系统 — 通过关键词触发自动注入项目规范和最佳实践
MCP Server 集成 — 将任何 MCP 工具连接为 gptme 工具（动态发现 + 加载）
Computer Use（完整桌面控制） — 通过自然语言命令控制 GUI 应用
gptme-codegraph MCP 工具 — 9 个 Tree-sitter AST 工具用于代码导航和影响分析

gptme 将你的终端变成多 Agent AI 工作站。它支持任意 LLM 提供商、本地优先、无约束——是最早的 Agent CLI 之一（2023 年），至今仍在活跃开发中。

相关文章：

你用 gptme 做过什么厉害的事？在评论区分享——我想听听你在自动化什么！

DEV Community