<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/">
  <channel>
    <title>DEV Community: Yang ella</title>
    <description>The latest articles on DEV Community by Yang ella (@yang_ella_f2a3e16ccb54550).</description>
    <link>https://dev.to/yang_ella_f2a3e16ccb54550</link>
    <image>
      <url>https://media2.dev.to/dynamic/image/width=90,height=90,fit=cover,gravity=auto,format=auto/https:%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Fuser%2Fprofile_image%2F1798708%2Fcee18cb1-620c-4347-b356-440781d1c184.png</url>
      <title>DEV Community: Yang ella</title>
      <link>https://dev.to/yang_ella_f2a3e16ccb54550</link>
    </image>
    <atom:link rel="self" type="application/rss+xml" href="https://dev.to/feed/yang_ella_f2a3e16ccb54550"/>
    <language>en</language>
    <item>
      <title>只用文件系统和 Bash，Vercel 做出了一套高效 RAG</title>
      <dc:creator>Yang ella</dc:creator>
      <pubDate>Mon, 30 Mar 2026 09:32:14 +0000</pubDate>
      <link>https://dev.to/yang_ella_f2a3e16ccb54550/zhi-yong-wen-jian-xi-tong-he-bashvercel-zuo-chu-liao-tao-gao-xiao-rag-2eh1</link>
      <guid>https://dev.to/yang_ella_f2a3e16ccb54550/zhi-yong-wen-jian-xi-tong-he-bashvercel-zuo-chu-liao-tao-gao-xiao-rag-2eh1</guid>
      <description>&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F4c47p2oweve0jrzgmtpc.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F4c47p2oweve0jrzgmtpc.webp" alt=" " width="800" height="582"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;不建向量库，也能做 RAG？Vercel 给了一个新答案&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;Vercel 发了一篇博客：&lt;a href="https://vercel.com/blog/build-knowledge-agents-without-embeddings" rel="noopener noreferrer"&gt;Build knowledge agents without embeddings&lt;/a&gt;。开源了一个知识库agent问答项目 &lt;a href="https://vercel.com/templates/ai/chat-sdk-knowledge-agent" rel="noopener noreferrer"&gt;Knowledge Agent Template&lt;/a&gt;。&lt;/p&gt;

&lt;p&gt;该项目不靠“embeddings”实现了一个知识库搜索问答系统。它把知识库当成一个可搜索的文件系统：模型在 sandbox 里调用 &lt;code&gt;grep&lt;/code&gt;、&lt;code&gt;find&lt;/code&gt;、&lt;code&gt;head&lt;/code&gt;、&lt;code&gt;cat&lt;/code&gt; 这些普通命令，先找文件，再读文件，再综合答案。&lt;/p&gt;

&lt;p&gt;按照官方博客的说法，他们内部一个销售电话总结 agent 的单次成本，从大约 &lt;code&gt;$1.00&lt;/code&gt; 降到了 &lt;code&gt;$0.25&lt;/code&gt;，而且输出质量还更好。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;为什么一套看起来很普通的文件系统操作，被 Vercel 重新组织之后，可以成为一条足够实用的 RAG 路线？&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;这篇文章就沿着这条主线展开，主要看三件事：&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;Vercel 这个项目具体是怎么做的。&lt;/li&gt;
&lt;li&gt;文件系统加 bash 为什么在代码、文档、知识库场景里有效。&lt;/li&gt;
&lt;li&gt;这套方法的边界、代价和适用范围在哪里。&lt;/li&gt;
&lt;/ol&gt;

&lt;h2&gt;
  
  
  这是个什么项目
&lt;/h2&gt;

&lt;p&gt;站在用户视角看，这个项目做的事情其实很好理解：&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;你先把知识接进来，用户再像平常聊天一样提问，Agent 则在后台真的去翻这些文件，然后把找到的内容组织成答案。&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;这里的“知识”，可以是 GitHub 仓库、文档内容、YouTube 转录等。接进来之后，它们不会先进向量库，而是会被整理成一份可以搜索的文件集合。&lt;/p&gt;

&lt;p&gt;所以对用户来说，体验大概就是三步：&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;管理员先把知识源接进系统。&lt;/li&gt;
&lt;li&gt;用户在 Web Chat、GitHub 或 Discord 里直接提问。&lt;/li&gt;
&lt;li&gt;Agent 在后台搜索真实文件、读取相关段落、整理答案返回给你。&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fl6g0o8eu9kjbmi1g2bzv.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fl6g0o8eu9kjbmi1g2bzv.webp" alt="一次真实问答中，Agent 在后台通过 bash 搜索和读取知识库文件" width="800" height="792"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;如果本地知识里找不到足够信息，当前这套实现还允许它再补一次 &lt;code&gt;web_search&lt;/code&gt;。&lt;/p&gt;

&lt;p&gt;从技术上看，这里面真正关键的动作也不多：&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;先把外部知识同步成一份 snapshot repo，内容都落成普通文件。&lt;/li&gt;
&lt;li&gt;查询时把这份文件快照挂到 Vercel Sandbox 里，并尽量复用已有 sandbox，减少启动开销。&lt;/li&gt;
&lt;li&gt;给模型开放 &lt;code&gt;bash&lt;/code&gt; 和 &lt;code&gt;bash_batch&lt;/code&gt; 两个受限工具，让它通过 &lt;code&gt;grep&lt;/code&gt;、&lt;code&gt;find&lt;/code&gt;、&lt;code&gt;head&lt;/code&gt;、&lt;code&gt;cat&lt;/code&gt; 这些命令完成搜索和阅读。&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;strong&gt;Vercel 这套方案最有价值的地方，是把文件系统检索做成了一条可复用、可解释、可控成本的工程路径。&lt;/strong&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  文件系统 + bash，怎么被组织成一套 RAG
&lt;/h2&gt;

&lt;p&gt;我找到了我关注的核心文本，其实就是一段系统提示词，源文件在 &lt;a href="https://github.com/vercel-labs/knowledge-agent-template/blob/main/packages/agent/src/prompts/chat.ts#L47" rel="noopener noreferrer"&gt;BASE_SYSTEM_PROMPT&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;重点是 &lt;code&gt;Fast Search Strategy&lt;/code&gt; 这一段。&lt;/p&gt;

&lt;p&gt;Agent 底层模型对bash读文件的操作天然了熟于心，Claude code/Codex 每次打开的时候就需要读文件，读系统指令，用户自定义指令，skill列表等。&lt;/p&gt;

&lt;p&gt;所以这段提示词里最值得看的，是这些命令如何被约束、组合和工程化。&lt;/p&gt;

&lt;h3&gt;
  
  
  1. 优先批次bash，一次读写
&lt;/h3&gt;

&lt;p&gt;&lt;code&gt;BASE_SYSTEM_PROMPT&lt;/code&gt; 里开头一句是：&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;ALWAYS prefer &lt;code&gt;bash_batch\&lt;/code&gt; over sequential &lt;code&gt;bash\&lt;/code&gt; calls. Combine search and read in the same batch.&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;提示词首先约束优先使用 &lt;code&gt;bash_batch&lt;/code&gt; 而不是串行 &lt;code&gt;bash&lt;/code&gt;, 同时尽量在一次batch执行中完成搜索文件和读文件操作。整段提示词都是这一句话的详细展开。&lt;/p&gt;

&lt;p&gt;内部定义了一个函数可以批量处理多条bash指令, 比如大模型可以一次把以下三条指令合并发下去：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;bash_batch: &lt;span class="o"&gt;[&lt;/span&gt;
  &lt;span class="s2"&gt;"grep -rl "&lt;/span&gt;keyword&lt;span class="s2"&gt;" docs/source1/ --include="&lt;/span&gt;&lt;span class="k"&gt;*&lt;/span&gt;.md&lt;span class="s2"&gt;" | head -5"&lt;/span&gt;,
  &lt;span class="s2"&gt;"grep -rl "&lt;/span&gt;keyword&lt;span class="s2"&gt;" docs/source2/ --include="&lt;/span&gt;&lt;span class="k"&gt;*&lt;/span&gt;.md&lt;span class="s2"&gt;" | head -5"&lt;/span&gt;,
  &lt;span class="s2"&gt;"head -100 docs/source1/getting-started/index.md"&lt;/span&gt;
&lt;span class="o"&gt;]&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;code&gt;bash_batch&lt;/code&gt; 的价值主要在于把多条命令打包成一次工具调用。&lt;/p&gt;

&lt;p&gt;它省下来的主要是：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;多轮工具调用带来的模型思考开销&lt;/li&gt;
&lt;li&gt;中间步骤的 token 消耗&lt;/li&gt;
&lt;li&gt;Agent 在长循环里越走越散的风险&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;对 Agent 来说，这更像是一次性打包检索计划：少几轮 tool loop，往往就少几轮试探和 token 消耗。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fa3znbr67u7n87xb4otgp.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fa3znbr67u7n87xb4otgp.webp" alt="在实际运行中，多个搜索和读取动作会被合并成更少的工具调用" width="800" height="772"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h3&gt;
  
  
  2. 克制检索文件，够用就行
&lt;/h3&gt;

&lt;p&gt;提示词里面给出bash指令指导用法：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight markdown"&gt;&lt;code&gt;&lt;span class="gu"&gt;### Quick reference&lt;/span&gt;
| Task | Command |
|------|---------|
| Find files by content | &lt;span class="se"&gt;\`&lt;/span&gt;grep -rl "keyword" docs/ --include="&lt;span class="err"&gt;*&lt;/span&gt;.md" | head -5&lt;span class="se"&gt;\`&lt;/span&gt; |
| Multi-keyword search | &lt;span class="se"&gt;\`&lt;/span&gt;grep -rlE "term1|term2" docs/ --include="&lt;span class="err"&gt;*&lt;/span&gt;.md" | head -5&lt;span class="se"&gt;\`&lt;/span&gt; |
| Find files by name | &lt;span class="se"&gt;\`&lt;/span&gt;find docs/ -name "&lt;span class="ge"&gt;*routing*&lt;/span&gt;" -name "&lt;span class="err"&gt;*&lt;/span&gt;.md"&lt;span class="se"&gt;\`&lt;/span&gt; |
| Read file (partial) | &lt;span class="se"&gt;\`&lt;/span&gt;head -100 docs/path/file.md&lt;span class="se"&gt;\`&lt;/span&gt; |
| Read file (full) | &lt;span class="se"&gt;\`&lt;/span&gt;cat docs/path/file.md&lt;span class="se"&gt;\`&lt;/span&gt; |
| Search with context | &lt;span class="se"&gt;\`&lt;/span&gt;grep -n -C3 "keyword" docs/path/file.md&lt;span class="se"&gt;\`&lt;/span&gt; |
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;然后提示词里面给出了正面样例和反面样例, 依然是提倡合并多个bash 调用。&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight markdown"&gt;&lt;code&gt;&lt;span class="gu"&gt;### Good vs Bad&lt;/span&gt;

&lt;span class="gs"&gt;**Good**&lt;/span&gt; — 1-2 calls:
&lt;span class="p"&gt;1.&lt;/span&gt; &lt;span class="se"&gt;\`&lt;/span&gt;bash_batch&lt;span class="se"&gt;\`&lt;/span&gt;: grep across likely dirs + read obvious files in one call
&lt;span class="p"&gt;2.&lt;/span&gt; &lt;span class="se"&gt;\`&lt;/span&gt;bash_batch&lt;span class="se"&gt;\`&lt;/span&gt;: read remaining files from grep results

&lt;span class="gs"&gt;**Bad**&lt;/span&gt; — 5+ calls:
&lt;span class="p"&gt;1.&lt;/span&gt; &lt;span class="se"&gt;\`&lt;/span&gt;find docs/ -maxdepth 2 -type d&lt;span class="se"&gt;\`&lt;/span&gt;
&lt;span class="p"&gt;2.&lt;/span&gt; &lt;span class="se"&gt;\`&lt;/span&gt;grep -rl "keyword" docs/source1/&lt;span class="se"&gt;\`&lt;/span&gt;
&lt;span class="p"&gt;3.&lt;/span&gt; &lt;span class="se"&gt;\`&lt;/span&gt;grep -rl "keyword" docs/source2/&lt;span class="se"&gt;\`&lt;/span&gt;
&lt;span class="p"&gt;4.&lt;/span&gt; &lt;span class="se"&gt;\`&lt;/span&gt;cat docs/source1/file1.md&lt;span class="se"&gt;\`&lt;/span&gt;
&lt;span class="p"&gt;5.&lt;/span&gt; &lt;span class="se"&gt;\`&lt;/span&gt;cat docs/source2/file2.md&lt;span class="se"&gt;\`&lt;/span&gt;

&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;最后的&lt;code&gt;Rules&lt;/code&gt;给出了更多bash优化的参考. 比如：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;使用&lt;code&gt;head -N&lt;/code&gt; 输出更小的文本，而不是一下子获取整个文件内容&lt;/li&gt;
&lt;li&gt;使用&lt;code&gt;grep -rlE "term1|term2"&lt;/code&gt; 同时搜索多个关键词&lt;/li&gt;
&lt;li&gt;使用&lt;code&gt;grep -rl&lt;/code&gt; 而不是 &lt;code&gt;grep -r&lt;/code&gt;，只获取文件路径，忽略匹配行&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;提示词里所有示例，本质都在强化同一个策略：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;先用 &lt;code&gt;grep -rl&lt;/code&gt; 找路径&lt;/li&gt;
&lt;li&gt;用 &lt;code&gt;head -N&lt;/code&gt; 只读局部&lt;/li&gt;
&lt;li&gt;一次搜索多个关键词&lt;/li&gt;
&lt;li&gt;尽量 1 到 2 次工具调用结束&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;它提供的是一种&lt;strong&gt;检索行为模板&lt;/strong&gt;：&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;不要漫无目的遍历目录&lt;/li&gt;
&lt;li&gt;不要一上来 &lt;code&gt;cat&lt;/code&gt; 大文件&lt;/li&gt;
&lt;li&gt;不要把一步一步的探索拆成很多轮工具调用&lt;/li&gt;
&lt;li&gt;先拿到候选文件，再做有针对性的读取&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;如果说传统 RAG 的很多工作花在“如何切 chunk”，那 Vercel 这里花的心思更像是：&lt;strong&gt;如何让模型像一个克制的命令行使用者。&lt;/strong&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  这套方案最适合什么场景
&lt;/h2&gt;

&lt;h3&gt;
  
  
  1. 个人知识库和 Agent 记忆
&lt;/h3&gt;

&lt;p&gt;如果你的知识库本来就是一堆 Markdown、日报、想法笔记、命令记录、Prompt 模板，那么先走文件系统检索几乎是最自然的选择。&lt;/p&gt;

&lt;p&gt;它比 embedding 更轻，也更接近日常工作方式：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;人自己就是按文件和目录在找东西&lt;/li&gt;
&lt;li&gt;Agent 也可以按文件和目录找东西&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;同时这也启发我们，在做个人知识库的时候，&lt;strong&gt;语义化的文件命名和文件夹命名&lt;/strong&gt;能极大提高agent的搜索效率。很多时候只要给 Agent 一份干净的目录，再配上一些 prompt 约束，已经能得到很不错的效果。&lt;/p&gt;

&lt;p&gt;另外我说的&lt;strong&gt;文件系统检索&lt;/strong&gt;完全不需要把 Vercel 这一整套都搬过来。&lt;/p&gt;

&lt;p&gt;像 sandbox、snapshot、共享沙箱池这些设计，更多是为了把系统做成一个能稳定服务多用户、多会话、多平台的产品。对个人来说，这套工程通常太重了。&lt;/p&gt;

&lt;p&gt;而且今天很多 Agent 本来就已经会做这件事。&lt;/p&gt;

&lt;p&gt;无论是 Claude Code、Codex，还是其他带 bash 能力的 coding agent，它们本来就会：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;读目录&lt;/li&gt;
&lt;li&gt;搜文件&lt;/li&gt;
&lt;li&gt;看局部内容&lt;/li&gt;
&lt;li&gt;根据文件证据组织答案&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;所以个人最有参考价值的，不是整套 Vercel 基础设施，而是它向我们释放的信号：最简单的文本匹配也许是最高效的检索方式。&lt;/p&gt;

&lt;h3&gt;
  
  
  2. 代码库问答
&lt;/h3&gt;

&lt;p&gt;这是它最天然的主场。&lt;/p&gt;

&lt;p&gt;代码库里最重要的信息，本来就大量存在于：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;文件名&lt;/li&gt;
&lt;li&gt;import 路径&lt;/li&gt;
&lt;li&gt;函数名&lt;/li&gt;
&lt;li&gt;类型名&lt;/li&gt;
&lt;li&gt;配置文件&lt;/li&gt;
&lt;li&gt;注释和 README&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;这些都非常适合 lexical search，而不太需要语义嵌入先做一层“翻译”。&lt;/p&gt;

&lt;h3&gt;
  
  
  3. API 文档和产品文档
&lt;/h3&gt;

&lt;p&gt;文档站也很适合，尤其是有清晰目录树、标题层级和稳定术语的文档。&lt;/p&gt;

&lt;p&gt;比如“认证怎么配”“路由在哪里定义”“某个 Hook 支持哪些参数”这类问题，本质都是在找明确的局部证据。&lt;/p&gt;

&lt;h2&gt;
  
  
  什么时候它会明显不如 embedding
&lt;/h2&gt;

&lt;p&gt;说完优点，也得把边界说清楚。&lt;/p&gt;

&lt;p&gt;文件系统 RAG 也有很清晰的边界。下面这些情况里，embedding 或 hybrid search 往往更稳。&lt;/p&gt;

&lt;h3&gt;
  
  
  1. 用户提问和文档表述没有词汇重合
&lt;/h3&gt;

&lt;p&gt;这其实是 embedding 诞生的根本原因。&lt;/p&gt;

&lt;p&gt;如果用户问的是模糊概念、近义表达、口语化描述，而知识库里的写法完全不同，&lt;code&gt;grep&lt;/code&gt; 很可能就是搜不到。&lt;/p&gt;

&lt;p&gt;例如：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;用户问“怎么做登录保护”&lt;/li&gt;
&lt;li&gt;文档写的是“route middleware” 或 “access control”&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;只靠关键词，很容易漏召回。&lt;/p&gt;

&lt;h3&gt;
  
  
  2. 知识非常松散、噪声很大
&lt;/h3&gt;

&lt;p&gt;比如 OCR 文档、杂乱 PDF、客服工单、聊天记录、大量口语转写，这些内容往往命名不规范、结构不稳定、同义表达很多。&lt;/p&gt;

&lt;p&gt;这种情况下，光靠路径和关键词，效果通常不会太好。&lt;/p&gt;

&lt;h3&gt;
  
  
  3. 语料规模很大，而且需要更强排序
&lt;/h3&gt;

&lt;p&gt;原始 &lt;code&gt;grep&lt;/code&gt; 擅长“找到包含这个词的文件”，但不擅长“把最相关的前几个文件稳定排到最前面”。&lt;/p&gt;

&lt;p&gt;在文件很多、匹配很多的情况下，你很快就会遇到两个问题：&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;候选文件太多&lt;/li&gt;
&lt;li&gt;排序质量不够&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;这时更自然的下一步，往往是先引入更成熟的 lexical ranking，比如 BM25、SQLite FTS、搜索引擎索引，甚至再叠一层 reranker。&lt;br&gt;
。&lt;/p&gt;

&lt;h3&gt;
  
  
  4. 多语言、别名、企业黑话很多
&lt;/h3&gt;

&lt;p&gt;如果同一件事在不同团队里有不同叫法，或者中文、英文、缩写混着来，文件系统检索的 recall 会变差。&lt;/p&gt;

&lt;p&gt;这类场景里，语义检索或者至少 hybrid search 往往更稳。&lt;/p&gt;

&lt;h2&gt;
  
  
  总结
&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;Vercel的做法是一种很“返璞归真”的工程方案。它不是万能解，但在代码库、API 文档、内部知识库这类强结构场景里，工程价值非常高。&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;这套方法很务实。&lt;strong&gt;但是它不覆盖所有检索问题&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;文件系统加关键词搜索，在这些场景里通常非常强：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;代码库&lt;/li&gt;
&lt;li&gt;API 文档&lt;/li&gt;
&lt;li&gt;内部 Wiki&lt;/li&gt;
&lt;li&gt;术语稳定的知识库&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;但如果问题换成下面这些，embedding 或 semantic search 依然会更重要：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;用户表达很模糊，和文档用词不重合&lt;/li&gt;
&lt;li&gt;数据高度非结构化&lt;/li&gt;
&lt;li&gt;同义词、别名、企业黑话很多&lt;/li&gt;
&lt;li&gt;文件很多，排序质量开始明显影响结果&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;所以社区里比较成熟的结论，并不是“以后都不用 embedding 了”，而是：&lt;strong&gt;先看语料，再定检索原语；很多时候 hybrid 才是最后的形态。&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;不是抛弃 embedding，而是抛弃“默认先上 embedding”的思维惯性。&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;很多时候，真正好用的 RAG，并不需要一开始就很重；它更需要清晰的证据路径、稳定的检索行为和可解释的结果。&lt;/p&gt;

&lt;h2&gt;
  
  
  参考
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;Vercel 博客：&lt;a href="https://vercel.com/blog/build-knowledge-agents-without-embeddings" rel="noopener noreferrer"&gt;Build knowledge agents without embeddings&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;Vercel 模板页：&lt;a href="https://vercel.com/templates/ai/chat-sdk-knowledge-agent" rel="noopener noreferrer"&gt;Chat SDK Knowledge Agent&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;GitHub 仓库：&lt;a href="https://github.com/vercel-labs/knowledge-agent-template" rel="noopener noreferrer"&gt;vercel-labs/knowledge-agent-template&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;Prompt 源码：&lt;a href="https://github.com/vercel-labs/knowledge-agent-template/blob/fa7414d688175be0903255de7f4318be5df33d4e/packages/agent/src/prompts/chat.ts" rel="noopener noreferrer"&gt;packages/agent/src/prompts/chat.ts&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;博客链接： &lt;a href="https://yeekal.com/ai/vercel-knowledge-agents-without-embeddings/" rel="noopener noreferrer"&gt;只用文件系统和 Bash，Vercel 做出了一套高效 RAG&lt;/a&gt;
&lt;/li&gt;
&lt;/ul&gt;

</description>
      <category>rag</category>
      <category>agents</category>
    </item>
    <item>
      <title>受够了网络反爬？这套 WebTop 方案，让云端 OpenClaw 像真人一样上网</title>
      <dc:creator>Yang ella</dc:creator>
      <pubDate>Sun, 22 Mar 2026 03:43:28 +0000</pubDate>
      <link>https://dev.to/yang_ella_f2a3e16ccb54550/shou-gou-liao-wang-luo-fan-pa-zhe-tao-webtop-fang-an-rang-yun-duan-openclaw-xiang-zhen-ren-yang-shang-wang-1npb</link>
      <guid>https://dev.to/yang_ella_f2a3e16ccb54550/shou-gou-liao-wang-luo-fan-pa-zhe-tao-webtop-fang-an-rang-yun-duan-openclaw-xiang-zhen-ren-yang-shang-wang-1npb</guid>
      <description>&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F59fmxpeuacw7ypoerfs8.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F59fmxpeuacw7ypoerfs8.png" alt=" " width="800" height="449"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;浏览器是网络世界的入口 &lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;对于云端部署的 OpenClaw，有一个最大的痛点，就是浏览器没有显示界面，这会对 OpenClaw 的浏览器自动化操作产生很大的影响。&lt;/p&gt;

&lt;p&gt;刷知乎、小红书、推特，或者看 Reddit 时，传统的 Headless（无头）浏览器几乎过不了人机验证，也很容易卡在扫码登录界面。&lt;/p&gt;

&lt;p&gt;云服务器没有显示器，你连验证码长什么样都看不到，更别提接管操作了。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;那么，有没有一种优雅的姿势，让云端的 OpenClaw 拥有一个“有血有肉”的真实桌面浏览器？&lt;/strong&gt; 就像我们在本地自己电脑上浏览网页一样自由？&lt;/p&gt;

&lt;p&gt;既能保留 Cookie 环境，又能在遇到验证码时，让你通过浏览器随时“远程附体”进行人工接管？&lt;/p&gt;

&lt;p&gt;我花了几天时间，反复追问 Claude、GPT、Grok、Gemini、Kimi，在我的云服务器上跑通了他们一致推荐的方案：&lt;strong&gt;WebTop + Tailscale&lt;/strong&gt;，并且成功登录谷歌、知乎、小红书等平台。&lt;/p&gt;

&lt;p&gt;从此访问网页畅通无阻，它甚至还能自己去谷歌搜索自己想了解的事物。&lt;/p&gt;

&lt;p&gt;我的实测环境&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;Oracle Cloud（新加坡区 Free Tier）4C CPU / 24GB 内存 。SCP 速度大约 1.5~2 MB/s，Ping 400ms延迟，所以远程桌面在人工接管时会感觉偏卡。好在 OpenClaw 自己通过 CDP 调用浏览器是本机通讯，不吃公网带宽，因此不会拖慢自动化性能。&lt;/p&gt;

&lt;p&gt;如果你把 WebTop 跑在离自己更近的 VPS（或本地超微机），延迟和带宽体验都会好很多。下面所有参数都基于这台机器调出来的“高配方案”，如果你的资源更紧张（比如 2C4G 或 2C8G），记得在部署前对照文中的可调项做减法，确保 CPU、内存、带宽都匹配自己的上限。&lt;/p&gt;
&lt;/blockquote&gt;

&lt;h2&gt;
  
  
  OpenClaw 需要什么样的浏览器环境
&lt;/h2&gt;

&lt;p&gt;为了发挥OpenClaw最大的潜力，它需要一个“有血有肉”的真实桌面浏览器，就像一个入职公司的正式员工，在自己的工位，用着 Chrome 浏览网页。&lt;/p&gt;

&lt;p&gt;那么，什么才是真实的浏览器环境？&lt;/p&gt;

&lt;p&gt;这个诉求再拆解一下：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;抗反爬：避免网站风控秒封&lt;/li&gt;
&lt;li&gt;浏览状态持久化： 它需要记住登录状态，浏览历史，cookie&lt;/li&gt;
&lt;li&gt;遇到登录/验证码可以人工接管&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;把这个需求喂给 AI 之后，首先了解到一个叫 Xvfb 的工具，它可以在服务器端为浏览器虚拟一个显示器，基本满足上面的诉求。&lt;/p&gt;

&lt;p&gt;不过我并没有止步于此，继续 push AI：有没有其他方案？有没有更优解？&lt;/p&gt;

&lt;p&gt;最后拿到四种候选方案，本质上都是在 Xvfb 上做了不同程度的封装：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Xvfb + noVNC&lt;/strong&gt;: 自己直接配置Xvfb，这是最原始的组合&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;WebTop&lt;/strong&gt;: LinuxServer.io 维护的 Docker 镜像，提供完整的 Linux 桌面环境，也内置浏览器。底层仍是 Xvfb，但做了完善封装，内存占用多一点，却换来稳定性和更简单的配置。无需客户端，浏览器即可访问远程桌面。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Selenium Chrome&lt;/strong&gt;: 官方 Selenium 浏览器镜像 + VNC，运行在 Docker 中的 Selenium + Chrome 调试环境，通过 Xvfb 虚拟显示服务器&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Playwright + xvfb&lt;/strong&gt;: 最轻量，但需手动配置 VNC&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;虽然 WebTop 内存占用更高，但稳定性、反爬效果、接管体验、配置流程都优秀得多，所以所有 AI 都建议我选 WebTop。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;理由：&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;我的机器内存充足（24GB）(建议不少于4G)&lt;/li&gt;
&lt;li&gt;人工接管体验最佳（完整桌面，可装扩展/调试工具）&lt;/li&gt;
&lt;li&gt;维护成本最低（Docker Compose 一键管理）&lt;/li&gt;
&lt;li&gt;稳定性最好（LinuxServer.io 持续维护）&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;下面是&lt;strong&gt;详细对比&lt;/strong&gt; 参考表格：&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;维度&lt;/th&gt;
&lt;th&gt;Xvfb + noVNC&lt;/th&gt;
&lt;th&gt;WebTop ⭐&lt;/th&gt;
&lt;th&gt;Selenium Chrome&lt;/th&gt;
&lt;th&gt;Playwright + xvfb&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;内存占用&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;~250MB&lt;/td&gt;
&lt;td&gt;~600MB&lt;/td&gt;
&lt;td&gt;~450MB&lt;/td&gt;
&lt;td&gt;~200MB&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;CPU（空闲）&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;低&lt;/td&gt;
&lt;td&gt;中（桌面环境）&lt;/td&gt;
&lt;td&gt;低-中&lt;/td&gt;
&lt;td&gt;低&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;网络（自动化）&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;CDP&lt;/td&gt;
&lt;td&gt;CDP&lt;/td&gt;
&lt;td&gt;CDP&lt;/td&gt;
&lt;td&gt;CDP&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;网络（人工接管）&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;中（VNC）&lt;/td&gt;
&lt;td&gt;中（VNC）&lt;/td&gt;
&lt;td&gt;中（VNC）&lt;/td&gt;
&lt;td&gt;中（VNC，需配置）&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;安装复杂度&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;⭐⭐⭐⭐ 复杂&lt;/td&gt;
&lt;td&gt;⭐ 简单&lt;/td&gt;
&lt;td&gt;⭐⭐ 较简单&lt;/td&gt;
&lt;td&gt;⭐⭐⭐ 中等&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;维护复杂度&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;⭐⭐⭐⭐ 复杂&lt;/td&gt;
&lt;td&gt;⭐ 简单&lt;/td&gt;
&lt;td&gt;⭐⭐ 较简单&lt;/td&gt;
&lt;td&gt;⭐⭐⭐ 中等&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;人工接管&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Web VNC&lt;/td&gt;
&lt;td&gt;完整桌面&lt;/td&gt;
&lt;td&gt;Web VNC&lt;/td&gt;
&lt;td&gt;需额外配置&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;接管体验&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;⭐⭐⭐ 一般&lt;/td&gt;
&lt;td&gt;⭐⭐⭐⭐⭐ 优秀&lt;/td&gt;
&lt;td&gt;⭐⭐⭐ 一般&lt;/td&gt;
&lt;td&gt;⭐⭐ 差&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;反爬效果&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;⭐⭐⭐⭐ 好&lt;/td&gt;
&lt;td&gt;⭐⭐⭐⭐⭐ 优秀&lt;/td&gt;
&lt;td&gt;⭐⭐ 差&lt;/td&gt;
&lt;td&gt;⭐⭐⭐ 一般&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;稳定性&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;⭐⭐⭐ 中等&lt;/td&gt;
&lt;td&gt;⭐⭐⭐⭐ 自动化稳定&lt;/td&gt;
&lt;td&gt;⭐⭐⭐⭐ 好&lt;/td&gt;
&lt;td&gt;⭐⭐⭐ 中等&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;&lt;strong&gt;说明：&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;内存占用&lt;/strong&gt;：Selenium 包含 fluxbox + Xvfb + noVNC + supervisord，实际占用约 450MB&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;网络（自动化）&lt;/strong&gt;：OpenClaw 通过 CDP 控制，所有方案带宽占用一致且很低&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;网络（人工接管）&lt;/strong&gt;：通过 VNC 传输屏幕图像，带宽占用中等（~1-5Mbps）&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;OpenClaw 性能&lt;/strong&gt;：CDP 不经过桌面环境，所有方案性能基本一致（差异&amp;lt;5%）&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;反爬效果&lt;/strong&gt;：WebTop 提供真实桌面环境，反爬效果最佳；Selenium 包含 &lt;code&gt;navigator.webdriver&lt;/code&gt; 等自动化指纹，容易被识别&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;稳定性&lt;/strong&gt;：WebTop 适合人工接管场景，Selenium 适合纯自动化场景&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  最终架构
&lt;/h2&gt;

&lt;p&gt;选定方案之后，我又为了稳定和安全加上了 Tailscale 私有网络、Watchdog 监控等配套组件，让远程桌面浏览器具备生产级可靠性。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;WebTop (Chromium)&lt;/strong&gt; - 持久化浏览器，Cookie/Session 永久保留&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;socat 端口转发&lt;/strong&gt; - 解决 Chromium 133+ 强制绑定 127.0.0.1 的问题&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Tailscale&lt;/strong&gt; - 私有网络，无需公网端口&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Watchdog&lt;/strong&gt; - 监控 CDP 端口，浏览器 freeze 时自动重启（&amp;lt;3秒恢复）&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Docker Healthcheck&lt;/strong&gt; - 容器健康监控
&lt;/li&gt;
&lt;/ul&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;
┌──────────────┐
│   Local PC   │
└──────┬───────┘
       │ 
┌──────▼───────┐
│  Tailscale   │ (私有网络)
└──────┬───────┘
       │  (3000/3001)
       ▼
┌─────────────────────────────────────────────┐
│ Oracle Cloud VPS                            │
│                                             │
│ ┌──────────────┐                            │
│ │  OpenClaw    │                            │
│ └──────┬───────┘                            │
│        │ CDP (127.0.0.1:9222)               │
│        ▼                                    │
│ ┌────────────────────────┐                  │
│ │ WebTop Container       │◄─────────────────┘
│ │ (XFCE Desktop)         │                  │
│ │                        │                  │
│ │  ├─ socat :9222        │                  │
│ │  │   └─&amp;gt; 127.0.0.1:9223│                  │
│ │  └─ Chromium :9223     │                  │
│ │                        │                  │
│ │  Watchdog Supervisor   │                  │
│ └────────────────────────┘                  │
└─────────────────────────────────────────────┘

&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;strong&gt;关键设计：&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;socat 监听 0.0.0.0:9222，转发到 Chromium 的 127.0.0.1:9223&lt;/li&gt;
&lt;li&gt;Watchdog 只重启浏览器进程，不重启整个容器&lt;/li&gt;
&lt;li&gt;桌面环境保持运行，Cookie/Session 不丢失&lt;/li&gt;
&lt;li&gt;解决浏览器 freeze（进程存在但 CDP 无响应）问题&lt;/li&gt;
&lt;li&gt;Healthcheck 仅用于容器状态监控，实际恢复由 Watchdog 完成&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;关键参数&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;4C 24GB 高配版本：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;✅ shm_size: 4GB（共享内存）&lt;/li&gt;
&lt;li&gt;✅ mem_limit: 8GB（内存限制）&lt;/li&gt;
&lt;li&gt;✅ cpus: 2.5（CPU 限制）&lt;/li&gt;
&lt;li&gt;✅ disk-cache-size: 512MB（磁盘缓存）&lt;/li&gt;
&lt;li&gt;✅ max-old-space-size: 4GB（V8 堆内存）&lt;/li&gt;
&lt;/ul&gt;

&lt;blockquote&gt;
&lt;p&gt;如果你是 2C4G/2C8G 等轻量实例，可以把 &lt;code&gt;mem_limit&lt;/code&gt; 下调到 4GB、&lt;code&gt;cpus&lt;/code&gt; 限制到 1.5，并酌情调小 &lt;code&gt;disk-cache-size&lt;/code&gt;。唯一的前提是要保证 &lt;code&gt;shm_size&lt;/code&gt; ≥ 2GB，否则 Chromium 很容易崩。所有这些参数都写在 docker-compose 里，实际部署前最好让 AI 再帮你根据机器规格复核一遍。&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;&lt;strong&gt;硬件建议&lt;/strong&gt;&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;档位&lt;/th&gt;
&lt;th&gt;CPU / RAM&lt;/th&gt;
&lt;th&gt;适用场景&lt;/th&gt;
&lt;th&gt;备注&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;最低可用&lt;/td&gt;
&lt;td&gt;2C / 4GB&lt;/td&gt;
&lt;td&gt;纯自动化 + 偶尔人工接管&lt;/td&gt;
&lt;td&gt;
&lt;code&gt;mem_limit&lt;/code&gt;≈4GB，&lt;code&gt;cpus&lt;/code&gt;≤1.5，&lt;code&gt;shm_size&lt;/code&gt; 保持 2GB；&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;建议标准&lt;/td&gt;
&lt;td&gt;4C / 16GB+&lt;/td&gt;
&lt;td&gt;稳定生产/推荐标准&lt;/td&gt;
&lt;td&gt;
&lt;code&gt;mem_limit&lt;/code&gt;≈6-8GB，&lt;code&gt;cpus&lt;/code&gt;≈2-3，&lt;code&gt;shm_size&lt;/code&gt;≈2-4GB 文章示例所用配置，足够支撑多标签、长时间持久化&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;既然要用 OpenClaw，就别把它当一个“聊天机器人”糊弄过去。太低配的云主机只能让你卡着干着急——与其在 2C2G 上耗时间，不如直接上够用的规格，把 OpenClaw 当成真正的提效助手，认真投入一次。&lt;/p&gt;

&lt;h2&gt;
  
  
  如何配置
&lt;/h2&gt;

&lt;p&gt;这份教程不是“照着 README 抄一遍”，而是我在 Oracle Cloud 4C24G 机器上连续调试、反复和 Claude / GPT / Grok / Gemini / Kimi 拉扯之后沉淀下来的生产级实践：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;先让 Claude 写出初版，再请 Kimi 和 GPT 并行 Review，来回改了 5 轮才都点头；&lt;/li&gt;
&lt;li&gt;紧接着让 Claude 自己在我的机器上动手部署，我在旁边盯日志，又针对异常修了 3 次；&lt;/li&gt;
&lt;li&gt;HTTPS 访问、X11 认证、socat 端口、s6 权限、Watchdog 逻辑这些坑我是一个个踩过来的。&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;因此这里的每个参数都有出处：要么是官方最佳实践，要么是我真实环境量出来的稳定值。你完全可以把这份步骤交给自己的 Claude 或 Codex 去执行，但&lt;strong&gt;务必要&lt;/strong&gt;结合你机器的 CPU/内存/带宽，把 &lt;code&gt;cpus&lt;/code&gt;、&lt;code&gt;mem_limit&lt;/code&gt;、&lt;code&gt;shm_size&lt;/code&gt;、&lt;code&gt;PASSWORD&lt;/code&gt; 等可调项提前改好。&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;&lt;strong&gt;建议直接把本文发给交给 Claude/Codex，让AI帮你配置。&lt;/strong&gt;&lt;br&gt;
文末有公众号扫码关注并回复 &lt;strong&gt;“webtop”&lt;/strong&gt; 可领取原始 MD 文件&lt;/p&gt;

&lt;p&gt;强烈建议看完整个教程再开始配置!!!&lt;br&gt;
强烈建议看完整个教程再开始配置!!!&lt;br&gt;
强烈建议看完整个教程再开始配置!!! 留意注释里所有需要自定义的参数&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;确认过硬件和网络都扛得住之后，就可以按照下面的 Step 1 ~ Step 3 一步步来。&lt;/p&gt;

&lt;h3&gt;
  
  
  Step 1: Tailscale 私有网络
&lt;/h3&gt;

&lt;h4&gt;
  
  
  1. VPS 安装 Tailscale
&lt;/h4&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;curl &lt;span class="nt"&gt;-fsSL&lt;/span&gt; https://tailscale.com/install.sh | sh
&lt;span class="nb"&gt;sudo &lt;/span&gt;tailscale up
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;复制终端输出的 &lt;code&gt;https://login.tailscale.com/...&lt;/code&gt; 链接，在本地浏览器授权登录。&lt;/p&gt;

&lt;h4&gt;
  
  
  2. 获取 Tailscale IP
&lt;/h4&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;tailscale ip &lt;span class="nt"&gt;-4&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;记录输出的 IP（如 &lt;code&gt;100.10.20.30&lt;/code&gt;），后续用 &lt;code&gt;$TS_IP&lt;/code&gt; 表示。&lt;/p&gt;

&lt;h4&gt;
  
  
  3. 本地安装 Tailscale
&lt;/h4&gt;

&lt;p&gt;在本地电脑安装 Tailscale 客户端，登录同一账号。&lt;/p&gt;

&lt;h3&gt;
  
  
  Step 2: 部署 Docker 环境
&lt;/h3&gt;

&lt;h4&gt;
  
  
  1. 安装 Docker
&lt;/h4&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;curl &lt;span class="nt"&gt;-fsSL&lt;/span&gt; https://get.docker.com | sh
&lt;span class="nb"&gt;sudo &lt;/span&gt;usermod &lt;span class="nt"&gt;-aG&lt;/span&gt; docker &lt;span class="nv"&gt;$USER&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;重新登录 SSH 使 docker 组生效。&lt;/p&gt;

&lt;h4&gt;
  
  
  2. 创建项目目录
&lt;/h4&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;&lt;span class="nb"&gt;mkdir&lt;/span&gt; &lt;span class="nt"&gt;-p&lt;/span&gt; /opt/openclaw-browser &lt;span class="o"&gt;&amp;amp;&amp;amp;&lt;/span&gt; &lt;span class="nb"&gt;cd&lt;/span&gt; /opt/openclaw-browser
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h4&gt;
  
  
  3. 创建浏览器启动脚本（带 Watchdog + socat 端口转发）
&lt;/h4&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;&lt;span class="nb"&gt;cat&lt;/span&gt; &lt;span class="o"&gt;&amp;gt;&lt;/span&gt; browser-launcher.sh &lt;span class="o"&gt;&amp;lt;&amp;lt;&lt;/span&gt; &lt;span class="sh"&gt;'&lt;/span&gt;&lt;span class="no"&gt;EOF&lt;/span&gt;&lt;span class="sh"&gt;'
#!/usr/bin/with-contenv bash

# WebTop 已设置 DISPLAY=:1，使用默认值或环境变量
export DISPLAY=&lt;/span&gt;&lt;span class="k"&gt;${&lt;/span&gt;&lt;span class="nv"&gt;DISPLAY&lt;/span&gt;&lt;span class="k"&gt;:-&lt;/span&gt;:1&lt;span class="k"&gt;}&lt;/span&gt;&lt;span class="sh"&gt;

# 等待 X server 就绪
while ! xdpyinfo &amp;gt;/dev/null 2&amp;gt;&amp;amp;1; do
  sleep 1
done
echo "[&lt;/span&gt;&lt;span class="si"&gt;$(&lt;/span&gt;&lt;span class="nb"&gt;date&lt;/span&gt;&lt;span class="si"&gt;)&lt;/span&gt;&lt;span class="sh"&gt;] X server ready, using DISPLAY=&lt;/span&gt;&lt;span class="nv"&gt;$DISPLAY&lt;/span&gt;&lt;span class="sh"&gt;"

echo "[&lt;/span&gt;&lt;span class="si"&gt;$(&lt;/span&gt;&lt;span class="nb"&gt;date&lt;/span&gt;&lt;span class="si"&gt;)&lt;/span&gt;&lt;span class="sh"&gt;] Browser Supervisor 启动，监控 CDP 端口..."

# 启动 CDP 端口代理（9222 -&amp;gt; 9223）
start_cdp_proxy() {
    pkill -f "socat.*TCP-LISTEN:9222" 2&amp;gt;/dev/null
    socat TCP-LISTEN:9222,fork,reuseaddr TCP:127.0.0.1:9223 &amp;amp;
    SOCAT_PID=&lt;/span&gt;&lt;span class="nv"&gt;$!&lt;/span&gt;&lt;span class="sh"&gt;
    echo "[&lt;/span&gt;&lt;span class="si"&gt;$(&lt;/span&gt;&lt;span class="nb"&gt;date&lt;/span&gt;&lt;span class="si"&gt;)&lt;/span&gt;&lt;span class="sh"&gt;] CDP 代理已启动 (9222 -&amp;gt; 9223)"
}

# 主循环：浏览器崩溃或假死时自动重启
while true; do
    echo "[&lt;/span&gt;&lt;span class="si"&gt;$(&lt;/span&gt;&lt;span class="nb"&gt;date&lt;/span&gt;&lt;span class="si"&gt;)&lt;/span&gt;&lt;span class="sh"&gt;] 清理锁文件..."
    rm -f /browser-data/Singleton*

    echo "[&lt;/span&gt;&lt;span class="si"&gt;$(&lt;/span&gt;&lt;span class="nb"&gt;date&lt;/span&gt;&lt;span class="si"&gt;)&lt;/span&gt;&lt;span class="sh"&gt;] 启动 Chromium (端口 9223)..."
    chromium-browser &lt;/span&gt;&lt;span class="se"&gt;\&lt;/span&gt;&lt;span class="sh"&gt;
      --user-data-dir=/browser-data &lt;/span&gt;&lt;span class="se"&gt;\&lt;/span&gt;&lt;span class="sh"&gt;
      --remote-debugging-port=9223 &lt;/span&gt;&lt;span class="se"&gt;\&lt;/span&gt;&lt;span class="sh"&gt;
      --remote-debugging-address=127.0.0.1 &lt;/span&gt;&lt;span class="se"&gt;\&lt;/span&gt;&lt;span class="sh"&gt;
      --remote-allow-origins="*" &lt;/span&gt;&lt;span class="se"&gt;\&lt;/span&gt;&lt;span class="sh"&gt;
      --no-sandbox &lt;/span&gt;&lt;span class="se"&gt;\&lt;/span&gt;&lt;span class="sh"&gt;
      --disable-gpu &lt;/span&gt;&lt;span class="se"&gt;\&lt;/span&gt;&lt;span class="sh"&gt;
      --disable-software-rasterizer &lt;/span&gt;&lt;span class="se"&gt;\&lt;/span&gt;&lt;span class="sh"&gt;
      --disable-features=VizDisplayCompositor &lt;/span&gt;&lt;span class="se"&gt;\&lt;/span&gt;&lt;span class="sh"&gt;
      --disable-blink-features=AutomationControlled &lt;/span&gt;&lt;span class="se"&gt;\&lt;/span&gt;&lt;span class="sh"&gt;
      --disable-crash-reporter &lt;/span&gt;&lt;span class="se"&gt;\&lt;/span&gt;&lt;span class="sh"&gt;
      --disable-breakpad &lt;/span&gt;&lt;span class="se"&gt;\&lt;/span&gt;&lt;span class="sh"&gt;
      --hide-crash-restore-bubble &lt;/span&gt;&lt;span class="se"&gt;\&lt;/span&gt;&lt;span class="sh"&gt;
      --restore-last-session &lt;/span&gt;&lt;span class="se"&gt;\&lt;/span&gt;&lt;span class="sh"&gt;
      --disable-features=TranslateUI &lt;/span&gt;&lt;span class="se"&gt;\&lt;/span&gt;&lt;span class="sh"&gt;
      --no-first-run &lt;/span&gt;&lt;span class="se"&gt;\&lt;/span&gt;&lt;span class="sh"&gt;
      --disable-background-timer-throttling &lt;/span&gt;&lt;span class="se"&gt;\&lt;/span&gt;&lt;span class="sh"&gt;
      --disable-renderer-backgrounding &lt;/span&gt;&lt;span class="se"&gt;\&lt;/span&gt;&lt;span class="sh"&gt;
      --disable-backgrounding-occluded-windows &lt;/span&gt;&lt;span class="se"&gt;\&lt;/span&gt;&lt;span class="sh"&gt;
      --disable-ipc-flooding-protection &lt;/span&gt;&lt;span class="se"&gt;\&lt;/span&gt;&lt;span class="sh"&gt;
      --password-store=basic &lt;/span&gt;&lt;span class="se"&gt;\&lt;/span&gt;&lt;span class="sh"&gt;
      --disk-cache-size=536870912 &lt;/span&gt;&lt;span class="se"&gt;\&lt;/span&gt;&lt;span class="sh"&gt;
      --max-old-space-size=4096 &amp;amp;

    BROWSER_PID=&lt;/span&gt;&lt;span class="nv"&gt;$!&lt;/span&gt;&lt;span class="sh"&gt;

    # 启动端口转发
    start_cdp_proxy

    # 健康监测：15秒检查一次（检查 socat 端口）
    while kill -0 &lt;/span&gt;&lt;span class="nv"&gt;$BROWSER_PID&lt;/span&gt;&lt;span class="sh"&gt; 2&amp;gt;/dev/null; do
        sleep 15
        if ! curl -sf http://localhost:9222/json/version &amp;gt;/dev/null 2&amp;gt;&amp;amp;1; then
            echo "[&lt;/span&gt;&lt;span class="si"&gt;$(&lt;/span&gt;&lt;span class="nb"&gt;date&lt;/span&gt;&lt;span class="si"&gt;)&lt;/span&gt;&lt;span class="sh"&gt;] 浏览器无响应，正在重启..."
            kill -TERM &lt;/span&gt;&lt;span class="nv"&gt;$BROWSER_PID&lt;/span&gt;&lt;span class="sh"&gt; 2&amp;gt;/dev/null
            sleep 2
            kill -KILL &lt;/span&gt;&lt;span class="nv"&gt;$BROWSER_PID&lt;/span&gt;&lt;span class="sh"&gt; 2&amp;gt;/dev/null
            kill -9 &lt;/span&gt;&lt;span class="nv"&gt;$SOCAT_PID&lt;/span&gt;&lt;span class="sh"&gt; 2&amp;gt;/dev/null
            sleep 2
            break
        fi
    done

    echo "[&lt;/span&gt;&lt;span class="si"&gt;$(&lt;/span&gt;&lt;span class="nb"&gt;date&lt;/span&gt;&lt;span class="si"&gt;)&lt;/span&gt;&lt;span class="sh"&gt;] 浏览器已停止，3秒后重启..."
    sleep 3
done
&lt;/span&gt;&lt;span class="no"&gt;EOF

&lt;/span&gt;&lt;span class="nb"&gt;chmod&lt;/span&gt; +x browser-launcher.sh
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h4&gt;
  
  
  4. 创建 Docker Compose 配置
&lt;/h4&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;&lt;span class="nb"&gt;cat&lt;/span&gt; &lt;span class="o"&gt;&amp;gt;&lt;/span&gt; docker-compose.yml &lt;span class="o"&gt;&amp;lt;&amp;lt;&lt;/span&gt; &lt;span class="sh"&gt;'&lt;/span&gt;&lt;span class="no"&gt;EOF&lt;/span&gt;&lt;span class="sh"&gt;'
services:
  webtop:
    image: lscr.io/linuxserver/webtop:ubuntu-xfce
    container_name: openclaw-browser
    security_opt:
      - seccomp:unconfined
    environment:
      - PUID=1001
      - PGID=1001
      - TZ=Asia/Shanghai
      - CUSTOM_USER=oclaw
      # - PASSWORD=&lt;/span&gt;&lt;span class="k"&gt;${&lt;/span&gt;&lt;span class="nv"&gt;WEBTOP_PASSWORD&lt;/span&gt;&lt;span class="k"&gt;:-&lt;/span&gt;&lt;span class="nv"&gt;ChangeMe123&lt;/span&gt;&lt;span class="p"&gt;!&lt;/span&gt;&lt;span class="k"&gt;}&lt;/span&gt;&lt;span class="sh"&gt;  # 已禁用密码认证，通过 Tailscale 私有网络保护, 如需密码可在此处设置
      - DOCKER_MODS=linuxserver/mods:universal-package-install
      - INSTALL_PACKAGES=socat
      - SELKIES_ENABLE_HTTPS=false
    volumes:
      - ./config:/config
      - &lt;/span&gt;&lt;span class="k"&gt;${&lt;/span&gt;&lt;span class="nv"&gt;HOME&lt;/span&gt;&lt;span class="k"&gt;}&lt;/span&gt;&lt;span class="sh"&gt;/workspace/webtop-browser-data:/browser-data
      - ./browser-launcher.sh:/config/scripts/browser-launcher.sh:ro
      - ./config/custom-cont-init.d:/custom-cont-init.d:ro
    ports:
      - "&lt;/span&gt;&lt;span class="k"&gt;${&lt;/span&gt;&lt;span class="nv"&gt;TAILSCALE_IP&lt;/span&gt;&lt;span class="k"&gt;}&lt;/span&gt;&lt;span class="sh"&gt;:3000:3000"
      - "&lt;/span&gt;&lt;span class="k"&gt;${&lt;/span&gt;&lt;span class="nv"&gt;TAILSCALE_IP&lt;/span&gt;&lt;span class="k"&gt;}&lt;/span&gt;&lt;span class="sh"&gt;:3001:3001"
      - "127.0.0.1:9222:9222"
    shm_size: "4gb"
    mem_limit: "8gb"
    cpus: "2.5"
    ulimits:
      nofile:
        soft: 65536
        hard: 65536
    tmpfs:
      - /tmp:size=1g
    restart: unless-stopped
    healthcheck:
      test: ["CMD-SHELL", "curl -sf http://localhost:9222/json/version &amp;gt;/dev/null"]
      interval: 15s
      timeout: 5s
      retries: 3
      start_period: 30s
&lt;/span&gt;&lt;span class="no"&gt;EOF
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h4&gt;
  
  
  5. 创建环境变量文件
&lt;/h4&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;&lt;span class="c"&gt;# 获取 Tailscale IP&lt;/span&gt;
&lt;span class="nv"&gt;TAILSCALE_IP&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="si"&gt;$(&lt;/span&gt;tailscale ip &lt;span class="nt"&gt;-4&lt;/span&gt;&lt;span class="si"&gt;)&lt;/span&gt;

&lt;span class="c"&gt;# 创建 .env 文件&lt;/span&gt;
&lt;span class="nb"&gt;cat&lt;/span&gt; &lt;span class="o"&gt;&amp;gt;&lt;/span&gt; .env &lt;span class="o"&gt;&amp;lt;&amp;lt;&lt;/span&gt; &lt;span class="no"&gt;EOF&lt;/span&gt;&lt;span class="sh"&gt;
TAILSCALE_IP=&lt;/span&gt;&lt;span class="k"&gt;${&lt;/span&gt;&lt;span class="nv"&gt;TAILSCALE_IP&lt;/span&gt;&lt;span class="k"&gt;}&lt;/span&gt;&lt;span class="sh"&gt;
&lt;/span&gt;&lt;span class="no"&gt;EOF
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;strong&gt;说明&lt;/strong&gt;：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;VNC 端口（3000/3001）绑定到 Tailscale IP，只能通过 Tailscale 网络访问&lt;/li&gt;
&lt;li&gt;已禁用密码认证，通过 Tailscale 私有网络保护访问安全，如需密码可在docker-compose.yml中设置&lt;/li&gt;
&lt;li&gt;CDP 端口（9222）绑定到 127.0.0.1，本地 OpenClaw 直接访问&lt;/li&gt;
&lt;li&gt;浏览器数据目录：&lt;code&gt;$HOME/workspace/webtop-browser-data&lt;/code&gt;（需提前创建）&lt;/li&gt;
&lt;li&gt;如果 Tailscale IP 变化，需要更新 .env 并重启容器&lt;/li&gt;
&lt;/ul&gt;

&lt;h4&gt;
  
  
  6. 配置浏览器自启动
&lt;/h4&gt;

&lt;ul&gt;
&lt;li&gt;✅ &lt;strong&gt;使用 custom-cont-init.d&lt;/strong&gt;：容器初始化时后台启动，避免 s6 服务管理问题&lt;/li&gt;
&lt;li&gt;✅ &lt;strong&gt;s6-setuidgid abc&lt;/strong&gt;：以 abc 用户运行浏览器，解决 X11 认证问题（root 无法显示窗口到 abc 的桌面）&lt;/li&gt;
&lt;li&gt;✅ &lt;strong&gt;后台启动 (&amp;amp;)&lt;/strong&gt;：避免阻塞容器启动流程
&lt;/li&gt;
&lt;/ul&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;&lt;span class="c"&gt;# 创建浏览器启动服务&lt;/span&gt;
&lt;span class="nb"&gt;mkdir&lt;/span&gt; &lt;span class="nt"&gt;-p&lt;/span&gt; config/custom-cont-init.d
&lt;span class="nb"&gt;cat&lt;/span&gt; &lt;span class="o"&gt;&amp;gt;&lt;/span&gt; config/custom-cont-init.d/01-start-browser &lt;span class="o"&gt;&amp;lt;&amp;lt;&lt;/span&gt; &lt;span class="sh"&gt;'&lt;/span&gt;&lt;span class="no"&gt;EOF&lt;/span&gt;&lt;span class="sh"&gt;'
#!/bin/bash
(
  # 等待 socat 安装完成
  while ! command -v socat &amp;gt;/dev/null 2&amp;gt;&amp;amp;1; do
    sleep 2
  done
  # 以 abc 用户运行浏览器（解决 X11 认证问题）
  exec s6-setuidgid abc /config/scripts/browser-launcher.sh
) &amp;amp;
&lt;/span&gt;&lt;span class="no"&gt;EOF

&lt;/span&gt;&lt;span class="c"&gt;# 赋予执行权限&lt;/span&gt;
&lt;span class="nb"&gt;chmod&lt;/span&gt; +x config/custom-cont-init.d/01-start-browser
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h4&gt;
  
  
  7. 创建浏览器数据目录
&lt;/h4&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;&lt;span class="c"&gt;# 创建浏览器数据目录&lt;/span&gt;
&lt;span class="nb"&gt;mkdir&lt;/span&gt; &lt;span class="nt"&gt;-p&lt;/span&gt; &lt;span class="nv"&gt;$HOME&lt;/span&gt;/workspace/webtop-browser-data
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h4&gt;
  
  
  8. 启动容器
&lt;/h4&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;&lt;span class="c"&gt;# (cd /opt/openclaw-browser &amp;amp;&amp;amp; docker compose up -d)&lt;/span&gt;
docker compose up &lt;span class="nt"&gt;-d&lt;/span&gt;
docker compose logs &lt;span class="nt"&gt;-f&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;等待 30 秒，看到 "Browser Supervisor 启动" 日志即成功。&lt;/p&gt;

&lt;p&gt;启动完成之后可快速检查&lt;strong&gt;CDP 端口响应：&lt;/strong&gt;&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;docker &lt;span class="nb"&gt;exec &lt;/span&gt;openclaw-browser curl &lt;span class="nt"&gt;-sf&lt;/span&gt; http://localhost:9222/json/version
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h3&gt;
  
  
  Step 3：OpenClaw 配置
&lt;/h3&gt;

&lt;p&gt;在 OpenClaw 配置文件中浏览器配置里添加 webtop ，并设为默认：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight json"&gt;&lt;code&gt;&lt;span class="w"&gt;  &lt;/span&gt;&lt;span class="nl"&gt;"browser"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="err"&gt;...&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"defaultProfile"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"webtop"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"profiles"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;

      &lt;/span&gt;&lt;span class="nl"&gt;"webtop"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="nl"&gt;"cdpUrl"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"http://127.0.0.1:9222"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="nl"&gt;"color"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"#00AA00"&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="err"&gt;...&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="err"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;如果你还没有配置过浏览器，你可以直接复制我的配置：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight json"&gt;&lt;code&gt;&lt;span class="w"&gt;  &lt;/span&gt;&lt;span class="nl"&gt;"browser"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"enabled"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="kc"&gt;true&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"headless"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="kc"&gt;false&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"noSandbox"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="kc"&gt;true&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"attachOnly"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="kc"&gt;false&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"defaultProfile"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"webtop"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"profiles"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"openclaw"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="nl"&gt;"cdpPort"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="mi"&gt;18800&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="nl"&gt;"color"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"#FF4500"&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"webtop"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="nl"&gt;"cdpUrl"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"http://127.0.0.1:9222"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="nl"&gt;"color"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"#00AA00"&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="err"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h3&gt;
  
  
  配置参数说明
&lt;/h3&gt;

&lt;h4&gt;
  
  
  环境变量 (.env)
&lt;/h4&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;参数&lt;/th&gt;
&lt;th&gt;默认值&lt;/th&gt;
&lt;th&gt;说明&lt;/th&gt;
&lt;th&gt;可修改&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;TAILSCALE_IP&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;可选设置&lt;/td&gt;
&lt;td&gt;Tailscale 私有网络 IP&lt;/td&gt;
&lt;td&gt;tailscale私有网络和密码保护至少选一项&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;WEBTOP_PASSWORD&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;未设置&lt;/td&gt;
&lt;td&gt;远程桌面登录密码（可选）&lt;/td&gt;
&lt;td&gt;✅ 如需密码保护可添加&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;h3&gt;
  
  
  Docker Compose 配置
&lt;/h3&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;参数&lt;/th&gt;
&lt;th&gt;默认值&lt;/th&gt;
&lt;th&gt;说明&lt;/th&gt;
&lt;th&gt;可修改&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;CUSTOM_USER&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;&lt;code&gt;claw&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;远程桌面用户名&lt;/td&gt;
&lt;td&gt;✅ 可自定义&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;TZ&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;&lt;code&gt;Asia/Shanghai&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;容器时区&lt;/td&gt;
&lt;td&gt;✅ 可改为其他时区&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;PUID/PGID&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;&lt;code&gt;1001&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;容器内用户 ID&lt;/td&gt;
&lt;td&gt;⚠️ 需与宿主机匹配，终端输入 &lt;code&gt;id&lt;/code&gt; 查询&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;shm_size&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;&lt;code&gt;4gb&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;共享内存大小&lt;/td&gt;
&lt;td&gt;✅ 可根据需求调整&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;ulimits.nofile&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;&lt;code&gt;65536&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;文件描述符限制&lt;/td&gt;
&lt;td&gt;✅ 可根据需求调整&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;tmpfs&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;&lt;code&gt;/tmp:size=1g&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;临时文件系统&lt;/td&gt;
&lt;td&gt;✅ 可根据需求调整&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;&lt;strong&gt;说明&lt;/strong&gt;：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;VNC 端口（3000/3001）绑定到 Tailscale IP，只能通过 Tailscale 网络访问&lt;/li&gt;
&lt;li&gt;默认无密码认证，通过 Tailscale 私有网络保护&lt;/li&gt;
&lt;li&gt;CDP 端口（9222）绑定到 127.0.0.1，供本地 OpenClaw 连接，不建议修改&lt;/li&gt;
&lt;li&gt;浏览器数据目录：&lt;code&gt;$HOME/workspace/webtop-browser-data&lt;/code&gt; 可自己修改&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;登录凭据&lt;/strong&gt;：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;当前配置：&lt;strong&gt;无需密码&lt;/strong&gt;，直接访问即可（通过 Tailscale 私有网络保护）&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;如需启用密码保护：&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;在 &lt;code&gt;docker-compose.yml&lt;/code&gt; 中取消注释 &lt;code&gt;PASSWORD&lt;/code&gt; 行：
&lt;/li&gt;
&lt;/ol&gt;
&lt;pre class="highlight yaml"&gt;&lt;code&gt; &lt;span class="pi"&gt;-&lt;/span&gt; &lt;span class="s"&gt;PASSWORD=${WEBTOP_PASSWORD:-ChangeMe123!}&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/li&gt;
&lt;/ul&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;p&gt;在 &lt;code&gt;.env&lt;/code&gt; 文件中添加：&lt;br&gt;
&lt;/p&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt; &lt;span class="nv"&gt;WEBTOP_PASSWORD&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;your_secure_password_here
&lt;/code&gt;&lt;/pre&gt;

&lt;/li&gt;
&lt;li&gt;&lt;p&gt;重启容器：&lt;code&gt;docker compose restart&lt;/code&gt;&lt;/p&gt;&lt;/li&gt;
&lt;/ol&gt;

&lt;h2&gt;
  
  
  本地如何连接远程浏览器验证
&lt;/h2&gt;

&lt;p&gt;这一步我们要在本地访问远程机器的浏览器，验证它是否稳定启动。&lt;/p&gt;

&lt;p&gt;首先获取远程机的私有网络地址（也可以直接在 Tailscale 客户端里看到）：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;tailscale ip &lt;span class="nt"&gt;-4&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;然后在本地浏览器访问 &lt;code&gt;https://&amp;lt;Tailscale_IP&amp;gt;:3001&lt;/code&gt;。&lt;/p&gt;

&lt;p&gt;大概率你会先看到“被安全拦截”的警告页。&lt;/p&gt;

&lt;p&gt;没关系，这是因为 WebTop 强制启用 HTTPS，但证书是自签名的，不被浏览器信任。&lt;/p&gt;

&lt;p&gt;点击 &lt;strong&gt;高级 → 继续访问&lt;/strong&gt; 即可。&lt;/p&gt;

&lt;p&gt;稍等片刻，就能看到远程浏览器已经打开。我习惯把谷歌设为主页，这里截图来自我用 iPad 访问的场景 —— 浏览器里的浏览器，挺像套娃😁，也可以直接在里面做搜索。&lt;/p&gt;

&lt;p&gt;也就是说无论你到哪里，只要能上网，随时可以查看云端龙虾的浏览器状态。&lt;/p&gt;


    


&lt;p&gt;不用担心浏览器异常退出，我写了监控脚本，每 15 秒检测一次状态；一旦崩溃会立刻重启。可以手动关掉浏览器，等 15 秒左右就会自动恢复，下面的视频是 ×4 加速的效果。&lt;/p&gt;


    


&lt;h2&gt;
  
  
  OpenClaw 实操
&lt;/h2&gt;

&lt;p&gt;经过我实测，OpenClaw 原生的 CDP 控制太差了，速度比较慢，截图总是截长图（似乎是个 &lt;a href="https://github.com/openclaw/openclaw/issues/244" rel="noopener noreferrer"&gt;bug: Screenshots capture full page instead of viewport by default&lt;/a&gt;）。&lt;/p&gt;

&lt;p&gt;所以这里我建议安装 &lt;a href="https://clawhub.ai/MaTriXy/agent-browser-clawdbot" rel="noopener noreferrer"&gt;Agent Browser&lt;/a&gt; 技能包。Agent Browser 是 Vercel 用 Rust 写的浏览器自动化工具，定位准、速度快，也更省 token。&lt;/p&gt;

&lt;p&gt;Agent Browser 支持&lt;strong&gt;通过 &lt;code&gt;--cdp 9222&lt;/code&gt; 连接 webtop 已有的 Chromium 进行工作&lt;/strong&gt;。 安装完技能，可以把上句加黑的文字发给龙虾并让他写入TOOLS.md。&lt;/p&gt;

&lt;p&gt;这样OpenClaw 就拥有了自己的桌面浏览器。&lt;/p&gt;

&lt;p&gt;你就可以干一些好玩的事了。&lt;/p&gt;

&lt;p&gt;比如总结博客内容的时候可以直接要求它截取文章中的关键数据表格，作为文章配图或者校验AI总结的数据准确性：&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fra8tocooe1cnkkdg46l9.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fra8tocooe1cnkkdg46l9.webp" alt="openai gpt 5.4 mini/nano 发布" width="800" height="936"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;AI热点监控的时候，比如Midjourney V8发布了，它不仅给我了内容要点，还发了几张参考图:&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F961mb2qxhotxdbsdgxyb.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F961mb2qxhotxdbsdgxyb.webp" alt="openclaw-browser-midjourney" width="800" height="1002"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;登录小红书小号:&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Flg8oej370hc6t01fz7sj.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Flg8oej370hc6t01fz7sj.webp" alt="openclaw-browser-xiaohongshu-login-1" width="800" height="971"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fko1yohal42a0bbra9092.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fko1yohal42a0bbra9092.webp" alt="openclaw-browser-xiaohongshu-login-2" width="800" height="1033"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;温馨提示：登录账号可以先使用小号尝试，避免账号被封。虽然该方案已经是云端浏览器自动化的最优解。&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;不过其实我们手动登录就行了，这里只是测试一下浏览器的能力。因为让它登个小红书其实花费了半个小时才登陆上，一方面中转站的api太慢了，另一方面浏览器自动化还需要和虾一起打磨打磨。&lt;/p&gt;

&lt;p&gt;登录完可玩的空间就大了，大家可以自行尝试。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Chrome DevTools MCP&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;另外提一下前两天 Google 发布的 Chrome DevTools MCP 工具，全网都在爆吹，不过这对云端的龙虾来说并没有做任何改善，只是利好本地 OpenClaw。因为该工具只是提供操控浏览器的接口，并不改变浏览器本身的状态，该工具的运行还是建立在 CDP 接口的基础上。但是有了 WebTop 就不一样了，OpenClaw 天然拥有完全属于自己的桌面浏览器，并且与用户看到的是共享的。&lt;/p&gt;

&lt;p&gt;也就是说在 Chrome DevTools MCP 工具发布之前，本地 OpenClaw 要与用户共享浏览器需要安装插件，而之后只需要开放开发者调试接口，不需要安装插件。而对于云端 OpenClaw，我们安装的 WebTop 解决了一切问题，浏览器天然属于共享状态。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Browse Use&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;在我写这篇文章的时候，Browser Use 刚巧上线了&lt;a href="https://x.com/browser_use/status/2035081807209931153" rel="noopener noreferrer"&gt;“直连 CDP”能力&lt;/a&gt;，可以通过&lt;code&gt;--cdp-url http://localhost:9222&lt;/code&gt;指定cdp接口。详细可参考&lt;a href="https://docs.browser-use.com/open-source/browser-use-cli" rel="noopener noreferrer"&gt;Browser Use CLI&lt;/a&gt;&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;browser-use &lt;span class="nt"&gt;--cdp-url&lt;/span&gt; http://localhost:9222 open https://example.com
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;官方也强调，这条路径就是为第三方云浏览器或自建实例准备的，只要你的浏览器通过 WebSocket 暴露了 CDP，就能被 Browser Use 驱动。而官方的更新也进一步验证了“真实桌面 + 持久化 CDP”的方案越来越成为Agent操纵浏览器重要的一部分。&lt;/p&gt;

&lt;p&gt;其实通过最近Chrome DevTools MCP工具的发布，Browse Use新增对CDP直连的支持，我们可以发现通过CDP端口直接控制浏览器会越来越成为主流。因为这样Agent不仅能控制本地电脑的真实浏览器，还能连接远程浏览器，也可以让云端Agent连接类似webtop这一类的浏览器。在&lt;a href="https://docs.openclaw.ai/tools/browser" rel="noopener noreferrer"&gt;openclaw的browser 文档&lt;/a&gt;里其实有推荐云端浏览器Browserbase，其中的控制方式就是通过CDP。也就是说，文档里描述的webtop方案是自己在服务器配置的，如果你不想配，你可以在云端浏览器提供商购买服务，它会给你开放一个浏览器实例，这个浏览器实例和服务器之间的控制方案就是CDP协议。&lt;/p&gt;

&lt;p&gt;我在openclaw里面一开始配置Agent Browser也是因为它原生支持CDP模式。不过现在Browse Use也支持了，后面可以尝试一下。&lt;/p&gt;

&lt;h2&gt;
  
  
  FAQ
&lt;/h2&gt;

&lt;blockquote&gt;
&lt;p&gt;遇到问题优先请教 Claude/Codex&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;&lt;strong&gt;Q: 想启用密码或公网访问？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
A: 默认依赖 Tailscale 隐私网络，不开放公网端口。如果必须暴露公网，务必在 docker-compose 里启用 &lt;code&gt;PASSWORD&lt;/code&gt; 并配置强口令，同时建议套上一层 Cloudflare Tunnel / Caddy 做额外认证。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Q: 远程桌面很卡怎么办？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
A: 文中示例的 VPS 在新加坡，我本人在国内，因此 SCP 只有 1.5~2 MB/s、延迟 400ms。人工接管时确实会感觉卡顿，但 OpenClaw 自动化走本地回环，速度不受影响。可以优先选择距离自己更近的节点（本地 NUC、同城云厂商等）&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Q: Tailscale IP 改了无法访问？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
A: 重新执行 &lt;code&gt;tailscale ip -4&lt;/code&gt;，把新 IP 写入 &lt;code&gt;.env&lt;/code&gt; 或直接更新 docker-compose 的 &lt;code&gt;TAILSCALE_IP&lt;/code&gt; 环境变量，然后 &lt;code&gt;docker compose down &amp;amp;&amp;amp; docker compose up -d&lt;/code&gt; 即可。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Q: 浏览器启动失败 / 无法打开新标签？&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
A: 99% 是共享内存不足，确认 &lt;code&gt;shm_size&lt;/code&gt; 至少 2GB，低配机器也不要低于 2048m；若系统 RAM 只有 4GB，最好把其它容器停掉。&lt;/p&gt;

&lt;h2&gt;
  
  
  参考链接
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;a href="https://docs.linuxserver.io/images/docker-webtop/" rel="noopener noreferrer"&gt;LinuxServer WebTop 官方文档&lt;/a&gt; —— 了解更多自定义参数及桌面环境支持。&lt;/li&gt;
&lt;li&gt;
&lt;a href="https://tailscale.com/kb/1017/install" rel="noopener noreferrer"&gt;Tailscale Quickstart&lt;/a&gt; —— 不同系统的安装与登录流程。&lt;/li&gt;
&lt;li&gt;&lt;a href="https://cn.aliyun.com/activity/ecs/clawdbot?from_alibabacloud=&amp;amp;userCode=bu3b1wdt" rel="noopener noreferrer"&gt;阿里云 Openclaw&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="https://cloud.tencent.com/act/cps/redirect?redirect=37945&amp;amp;cps_key=342f7a3d9f65d3a8fdfe7e5d7199137a" rel="noopener noreferrer"&gt;腾讯云 Openclaw&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="https://docs.browser-use.com/open-source/browser-use-cli" rel="noopener noreferrer"&gt;Browser Use CLI&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="https://agent-browser.dev/cdp-mode" rel="noopener noreferrer"&gt;Agent Browser CDP mode&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;blockquote&gt;
&lt;p&gt;&lt;strong&gt;建议直接把本文发给交给 Claude/Codex，让AI帮你配置。&lt;/strong&gt;&lt;br&gt;
公众号扫码关注并回复 &lt;strong&gt;“webtop”&lt;/strong&gt; 可领取原始 markdown 文件(AI更容易看懂)&lt;br&gt;
原文链接： &lt;a href="https://yeekal.com/ai/openclaw-cloud-desktop-browser/" rel="noopener noreferrer"&gt;https://yeekal.com/ai/openclaw-cloud-desktop-browser/&lt;/a&gt;&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Frqf9i2tslymf7hjpxanx.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Frqf9i2tslymf7hjpxanx.webp" alt="欢迎关注 Yee的出海手记 " width="800" height="264"&gt;&lt;/a&gt;&lt;/p&gt;

</description>
      <category>automation</category>
      <category>cloud</category>
      <category>openclaw</category>
      <category>webscraping</category>
    </item>
    <item>
      <title>OpenClaw限流有救了！免费Nvidia API+阿里云百炼接入指南</title>
      <dc:creator>Yang ella</dc:creator>
      <pubDate>Tue, 24 Feb 2026 14:17:21 +0000</pubDate>
      <link>https://dev.to/yang_ella_f2a3e16ccb54550/openclawxian-liu-you-jiu-liao-mian-fei-nvidia-apia-li-yun-bai-lian-jie-ru-zhi-nan-1kjb</link>
      <guid>https://dev.to/yang_ella_f2a3e16ccb54550/openclawxian-liu-you-jiu-liao-mian-fei-nvidia-apia-li-yun-bai-lian-jie-ru-zhi-nan-1kjb</guid>
      <description>&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F0oeih6hi4vro311tlxkl.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F0oeih6hi4vro311tlxkl.webp" alt=" " width="800" height="449"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;之前买的kimi coding plan 又限流了，先用免费模型顶一顶。&lt;/p&gt;

&lt;p&gt;推荐两家，nvidia 和 opencode zen&lt;/p&gt;

&lt;p&gt;opencode zen 在openclaw里面原生支持，只需要在模型配置里面输入api key就可以了&lt;/p&gt;

&lt;p&gt;nvidia 为了宣传自家的GPU基础设施,提供对当前主流开源模型的支持, 比如千问的 &lt;code&gt;qwen3.5-397b-a17b&lt;/code&gt;, 智谱的 &lt;code&gt;glm-5&lt;/code&gt;, kimi 的 &lt;code&gt;kimi-k2.5&lt;/code&gt;，minimax 的 &lt;code&gt;minimax-m2.1&lt;/code&gt;. &lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fzqnqp9ytqud8lq65xy8p.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fzqnqp9ytqud8lq65xy8p.webp" alt="nvidia-support-models" width="800" height="349"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;官方宣称最高40rpm，实际测试虽然可能没有这么高，但是它免费，模型选择多，并且限速之后等一会就又可以用了，作为免费api可以说是最优选择。比那些groq之流只提供一年前的老旧小模型比要好多了。&lt;/p&gt;

&lt;h2&gt;
  
  
  Nvidia api 接入
&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;首先要申请api key：&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;访问 &lt;a href="https://build.nvidia.com/models" rel="noopener noreferrer"&gt;https://build.nvidia.com/models&lt;/a&gt; 注册登录&lt;/li&gt;
&lt;li&gt;右上角头像点击-选择 api keys - 点击 &lt;code&gt;Generate API Key&lt;/code&gt; 创建&lt;/li&gt;
&lt;li&gt;拷贝API key 备用&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;写入openclaw的配置文件&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;配置文件一般在 &lt;code&gt;~/.openclaw/openclaw.json&lt;/code&gt;, 在该文件里面加入一下models配置，&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight json"&gt;&lt;code&gt;&lt;span class="nl"&gt;"models"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"mode"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"merge"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"providers"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"nvidia"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="nl"&gt;"baseUrl"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"https://integrate.api.nvidia.com/v1"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="nl"&gt;"apiKey"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"${NVIDIA_API_KEY}"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="nl"&gt;"api"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"openai-completions"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="nl"&gt;"models"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nl"&gt;"id"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"moonshotai/kimi-k2.5"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nl"&gt;"name"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"Kimi K2.5"&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
            &lt;/span&gt;&lt;span class="nl"&gt;"reasoning"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="kc"&gt;true&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
            &lt;/span&gt;&lt;span class="nl"&gt;"input"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="w"&gt;
              &lt;/span&gt;&lt;span class="s2"&gt;"text"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
              &lt;/span&gt;&lt;span class="s2"&gt;"image"&lt;/span&gt;&lt;span class="w"&gt;
            &lt;/span&gt;&lt;span class="p"&gt;]&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nl"&gt;"id"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"minimaxai/minimax-m2.1"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nl"&gt;"name"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"Minimax M2.1"&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
            &lt;/span&gt;&lt;span class="nl"&gt;"reasoning"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="kc"&gt;true&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
            &lt;/span&gt;&lt;span class="nl"&gt;"input"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="w"&gt;
              &lt;/span&gt;&lt;span class="s2"&gt;"text"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
              &lt;/span&gt;&lt;span class="s2"&gt;"image"&lt;/span&gt;&lt;span class="w"&gt;
            &lt;/span&gt;&lt;span class="p"&gt;]&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="p"&gt;]&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;同时记得在agents.defaults.model.primary 改为你想使用的模型，比如 "nvidia/moonshotai/kimi-k2.5"，参考下图：&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fnvz1wg6k7hl261kxc432.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fnvz1wg6k7hl261kxc432.webp" alt="nvidia-model-config" width="800" height="1029"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;这里多说一下模型配置参数的含义。models 里面主要看providers这个结构，它定义了不同的模型提供者，比如这里我们写的是nvidia。每一个provider下面可以定义很多个模型，通过id来索引。所以如果逆向添加nvidia的其它模型，就可以按照这个格式来加入。同理如果是其它api的提供者，那就在 "nvidia" 这个层级下加一个类似结构。而agents.defaults.model.primary里面写入"nvidia/moonshotai/kimi-k2.5"就代表使用nvidia下的moonshotai/kimi-k2.5模型。&lt;/p&gt;

&lt;p&gt;另外 apiKey 这里 你可以直接把上述的key直接贴入。或者更模块化的方式是在 ~/.openclaw 下面新建一个&lt;code&gt;.env&lt;/code&gt;文件，以变量形式写入：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;&lt;span class="c"&gt;# .env 文件内容&lt;/span&gt;
&lt;span class="nv"&gt;NVIDIA_API_KEY&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;your_api_key_here
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;以上配置完成重启gateway就可以了，一般情况更改完openclaw.json会自动重启，如果没有就手动重启&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;openclaw gateway restart&lt;/p&gt;
&lt;/blockquote&gt;

&lt;h2&gt;
  
  
  阿里云百炼 Coding Plan 接入
&lt;/h2&gt;

&lt;p&gt;如果你觉得Nvidia的免费API不够用，或者需要更稳定的调用体验，阿里云百炼的Coding Plan是个不错的补充方案。&lt;/p&gt;

&lt;p&gt;之前我写过一篇阿里云部署OpenClaw的教程 &lt;a href="https://yeekal.com/notes/openclaw-aliyun-deploy/" rel="noopener noreferrer"&gt;阿里云部署OpenClaw：79元/年搭24小时AI代理&lt;/a&gt;，算是和云部署闭环了。现在阿里云又推出了Coding Plan活动，Lite基础套餐首月仅需7.9元（原价40元/月），包含18000次调用，性价比很高。&lt;/p&gt;

&lt;p&gt;Lite版本最多18000次请求，Pro版本90000次。套餐内不仅有千问系列模型，还支持GLM-5、Kimi K2.5等第三方模型。&lt;/p&gt;

&lt;p&gt;不过需要注意，这是首月优惠价。模型更新迭代快，建议按月购买，避免被绑定。&lt;/p&gt;

&lt;p&gt;链接在这里：&lt;a href="https://cn.aliyun.com/benefit/scene/codingplan?from_alibabacloud=&amp;amp;userCode=bu3b1wdt" rel="noopener noreferrer"&gt;https://cn.aliyun.com/benefit/scene/codingplan?from_alibabacloud=&amp;amp;userCode=bu3b1wdt&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;阿里云的套餐和nvidia的模型接入类似，两个都没有openclaw的官方接入点，只能通过openai兼容接口接入, 可以参考以上nvidia接入的方式，在配置文件内修改models参数如下：&lt;/p&gt;

&lt;p&gt;(注意，如果要保留nvidia接口，注意不要删除nvidia的配置参数)&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight json"&gt;&lt;code&gt;&lt;span class="nl"&gt;"models"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"mode"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"merge"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"providers"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"bailian"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"baseUrl"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"https://coding.dashscope.aliyuncs.com/v1"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"apiKey"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"YOUR_API_KEY"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"api"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"openai-completions"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"models"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"id"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"qwen3.5-plus"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"name"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"qwen3.5-plus"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"reasoning"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="kc"&gt;false&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"contextWindow"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="mi"&gt;1000000&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"maxTokens"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="mi"&gt;65536&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"id"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"qwen3-max-2026-01-23"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"name"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"qwen3-max-2026-01-23"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"reasoning"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="kc"&gt;false&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"contextWindow"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="mi"&gt;262144&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"maxTokens"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="mi"&gt;65536&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"id"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"qwen3-coder-next"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"name"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"qwen3-coder-next"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"contextWindow"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="mi"&gt;262144&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"maxTokens"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="mi"&gt;65536&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"id"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"qwen3-coder-plus"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"name"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"qwen3-coder-plus"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"contextWindow"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="mi"&gt;1000000&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"maxTokens"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="mi"&gt;65536&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"id"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"glm-5"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"name"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"glm-5"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"reasoning"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="kc"&gt;false&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"contextWindow"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="mi"&gt;202752&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"maxTokens"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="mi"&gt;16384&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"id"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"glm-4.7"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"name"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"glm-4.7"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"reasoning"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="kc"&gt;false&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"contextWindow"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="mi"&gt;202752&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"maxTokens"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="mi"&gt;16384&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"id"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"kimi-k2.5"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"name"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"kimi-k2.5"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"reasoning"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="kc"&gt;false&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"contextWindow"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="mi"&gt;262144&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
          &lt;/span&gt;&lt;span class="nl"&gt;"maxTokens"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="mi"&gt;32768&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="p"&gt;]&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;apikey 和 修改agents.defaults.model.primary跟nvidia的类似，想用哪个模型就把agents.defaults.model.primary改成 对应{provider}/{id}的形式。&lt;/p&gt;

&lt;h2&gt;
  
  
  总结
&lt;/h2&gt;

&lt;p&gt;Nvidia API和阿里云百炼Coding Plan该如何选择？&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Nvidia免费API的优势：&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;完全免费，无需付费&lt;/li&gt;
&lt;li&gt;模型丰富，支持Qwen3.5、GLM-5、Kimi K2.5、MiniMax M2.1等主流模型&lt;/li&gt;
&lt;li&gt;适合轻度使用和临时应急&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;阿里云百炼Coding Plan的优势：&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;稳定可靠，7.9元/月起&lt;/li&gt;
&lt;li&gt;调用次数充足（Lite 18000次/月，Pro 90000次/月）&lt;/li&gt;
&lt;li&gt;首月费用低，性价比突出&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;推荐策略：&lt;/strong&gt; 两者可以同时配置，Nvidia作为日常主力，阿里云作为备选方案。在openclaw中可以通过切换primary模型灵活切换，非常方便。这样即使一边限流，另一边也能顶上，再也不用忍受漫长的等待了。&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;openclaw 部署系列文章：&lt;/p&gt;
&lt;/blockquote&gt;

&lt;ul&gt;
&lt;li&gt;&lt;a href="https://yeekal.com/notes/openclaw-aliyun-deploy/" rel="noopener noreferrer"&gt;阿里云部署OpenClaw：79元/年搭24小时AI代理&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="https://yeekal.com/notes/openclaw-vps-server-setup/" rel="noopener noreferrer"&gt;0元搭建7×24h AI助手：OpenClaw云服务器部署完全指南&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;

</description>
      <category>ai</category>
      <category>api</category>
      <category>llm</category>
      <category>tutorial</category>
    </item>
    <item>
      <title>0元搭建7 24h AI助手：OpenClaw云服务器部署完全指南</title>
      <dc:creator>Yang ella</dc:creator>
      <pubDate>Fri, 06 Feb 2026 08:59:31 +0000</pubDate>
      <link>https://dev.to/yang_ella_f2a3e16ccb54550/0yuan-da-jian-7x24h-aizhu-shou-openclawyun-fu-wu-qi-bu-shu-wan-quan-zhi-nan-5hlf</link>
      <guid>https://dev.to/yang_ella_f2a3e16ccb54550/0yuan-da-jian-7x24h-aizhu-shou-openclawyun-fu-wu-qi-bu-shu-wan-quan-zhi-nan-5hlf</guid>
      <description>&lt;ul&gt;
&lt;li&gt;听说你想要一个免费的云端 OpenClaw 助手？&lt;/li&gt;
&lt;li&gt;各个云厂商的 OpenClaw 方案该怎么选？&lt;/li&gt;
&lt;li&gt;我在本地机器上直接安装 OpenClaw 不行么？&lt;/li&gt;
&lt;li&gt;是否有必要准备一台 Mac Mini 部署 OpenClaw？&lt;/li&gt;
&lt;li&gt;VPS 裸机怎么从头开始部署 OpenClaw？&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;如果你有上述疑问，那么这篇文章就是为你而写。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fsfmso2idxnhfmiemz2al.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fsfmso2idxnhfmiemz2al.webp" alt=" "&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  本文内容概览
&lt;/h2&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;OpenClaw 是什么&lt;/strong&gt;：从 Clawdbot 到 OpenClaw 的演变，以及它为什么火爆&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;部署方案全景对比&lt;/strong&gt;：本地 / Mac Mini / 云服务器三种方案怎么选&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;云厂商套餐横向评测&lt;/strong&gt;：阿里云、百度云、腾讯云等免费/低价方案对比&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;云服务器从零部署完整教程&lt;/strong&gt;：SSH 配置、Swap 内存、Node 环境、安装排错&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;国内 IM 接入&lt;/strong&gt;：飞书、QQ、企业微信配置指南&lt;/li&gt;
&lt;/ol&gt;

&lt;h2&gt;
  
  
  第一部分：OpenClaw 是什么
&lt;/h2&gt;

&lt;h3&gt;
  
  
  1.1 项目演变史
&lt;/h3&gt;

&lt;p&gt;OpenClaw 的诞生引发了开源界的广泛关注。它由 &lt;strong&gt;Peter Steinberger&lt;/strong&gt;（知名 PDF 开发框架 PSPDFKit 创始人）在 2025 年底发布，GitHub Star 数在短时间内快速增长——据第三方统计，项目在 2026 年 1 月底的 72 小时内增长超过 6 万 Star，峰值时超过 14 万 Star，成为当时最受关注的开源项目之一。&lt;/p&gt;

&lt;p&gt;项目名称经历了两次变更：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Clawdbot&lt;/strong&gt;：最初名称，因与 Anthropic 的 Claude 发音过于相似，被 Anthropic 法务要求改名&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Moltbot&lt;/strong&gt;：2026 年 1 月 27 日过渡名，灵感来源于龙虾蜕皮（Molting）&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;OpenClaw&lt;/strong&gt;：2026 年 1 月 30 日至今，强调开源特性，吉祥物是一只可爱的"太空龙虾" Molty 🦞&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  1.2 核心定位：从"聊天"到"行动"
&lt;/h3&gt;

&lt;p&gt;传统 AI 助手（ChatGPT、Claude）只能给你建议，而 OpenClaw 被形容为 &lt;strong&gt;"Claude with hands"&lt;/strong&gt;（有手的 Claude）——它能真正动手执行任务：&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;场景&lt;/th&gt;
&lt;th&gt;传统 AI&lt;/th&gt;
&lt;th&gt;OpenClaw&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;收件箱满了&lt;/td&gt;
&lt;td&gt;"建议你清理一下邮件"&lt;/td&gt;
&lt;td&gt;直接打开邮箱，分类邮件，删除垃圾邮件&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;想订机票&lt;/td&gt;
&lt;td&gt;"推荐你上携程看看"&lt;/td&gt;
&lt;td&gt;打开浏览器，搜索航班，完成预订&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;代码部署&lt;/td&gt;
&lt;td&gt;"你可以运行 git push"&lt;/td&gt;
&lt;td&gt;自动执行 git 提交、推送、创建 PR&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;数据分析&lt;/td&gt;
&lt;td&gt;"建议用 Python 处理"&lt;/td&gt;
&lt;td&gt;编写并执行脚本，输出分析结果&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;h3&gt;
  
  
  1.3 核心特性
&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;本地优先（Local-First）&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;不同于传统云端 AI 助手，OpenClaw 完全运行在用户本地设备或私有服务器上，所有数据处理、聊天记录、文件访问均在本地完成，无需上传至第三方云端。这彻底解决了隐私泄露风险，让用户对 AI 拥有完全控制权，符合"Sovereign AI"（主权 AI）理念&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;系统级执行能力&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;OpenClaw 突破了"只会聊天"的局限，具备真实的系统操作权限。它可以读写本地文件、执行 Shell 命令、控制浏览器自动化、调用外部 API、管理日历邮件等。用户只需在聊天软件中发送指令（如"整理上周发票并生成 Excel"），它即可自动完成全流程任务，被称为"带了双手的 Claude"&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;移动原生:像微信好友一样随手聊&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;别的 AI 工具像是一个"专业软件"：你得专门打开网页、登录账号、在对话框里打字，用完了还得记得登出。&lt;br&gt;
OpenClaw 更像是你通讯录里的一个聪明朋友。它直接集成在你每天不离手的微信、WhatsApp 或飞书里。你在地铁上收到老板消息，随手转发给它："把这份合同的关键条款摘要出来"，它就像回微信一样秒回你；你在床上突然想起明天的汇报，语音吩咐一句"帮我做个 PPT 大纲"，它立马开工。不需要下载新 APP，不需要学新界面，用最顺手的方式就能指挥 AI 干活。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;7×24h在线：自主运行与持久记忆&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;OpenClaw是一个随时在线的私人助理，不仅能被动响应指令，更能主动发起任务（如定时提醒、监控邮件），并持续运行直至任务完成。它通过 Markdown 文件 + SQLite 数据库存储长期记忆，保留用户偏好、历史对话和项目上下文，实现跨会话的连贯工作流，而非"用完即忘"的传统对话模式&lt;/p&gt;
&lt;h3&gt;
  
  
  1.4 为什么你需要它
&lt;/h3&gt;

&lt;p&gt;如果你符合以下任意场景，OpenClaw 值得一试：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;数字游民&lt;/strong&gt;：需要 7×24h 在线助手处理邮件、日程、消息&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;开发者&lt;/strong&gt;：希望自动化 GitHub 操作、代码审查、监控告警&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;运维人员&lt;/strong&gt;：需要定时检查服务器状态、执行脚本、发送报告&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;效率控&lt;/strong&gt;：厌倦了重复性工作，想把时间留给创造性思考&lt;/li&gt;
&lt;/ul&gt;
&lt;h2&gt;
  
  
  第二部分：部署方案全景对比
&lt;/h2&gt;

&lt;p&gt;OpenClaw 的硬件要求极低（2GB RAM 即可），这意味着你有多种部署选择。以下是三种主流方案的详细对比：&lt;/p&gt;
&lt;h3&gt;
  
  
  2.1 方案总览对比
&lt;/h3&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;对比维度&lt;/th&gt;
&lt;th&gt;本地部署&lt;/th&gt;
&lt;th&gt;Mac Mini 方案&lt;/th&gt;
&lt;th&gt;云服务器部署&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;成本&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;免费（现有设备）&lt;/td&gt;
&lt;td&gt;中等（一次性投入）&lt;/td&gt;
&lt;td&gt;较低-中等（按年付费）&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;在线时长&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;随电脑开关机&lt;/td&gt;
&lt;td&gt;7×24h&lt;/td&gt;
&lt;td&gt;7×24h&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;公网访问&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;❌ 需内网穿透&lt;/td&gt;
&lt;td&gt;❌ 需内网穿透&lt;/td&gt;
&lt;td&gt;✅ 独立公网IP&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;海外网络&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;❌ 需配置VPN&lt;/td&gt;
&lt;td&gt;❌ 需配置VPN&lt;/td&gt;
&lt;td&gt;✅ 海外服务器&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;稳定性&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;一般&lt;/td&gt;
&lt;td&gt;极高&lt;/td&gt;
&lt;td&gt;高&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;维护难度&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;低&lt;/td&gt;
&lt;td&gt;中&lt;/td&gt;
&lt;td&gt;中&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;系统支持&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;跨平台&lt;/td&gt;
&lt;td&gt;&lt;strong&gt;macOS 最完善&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;跨平台（Linux 为主）&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;适用场景&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;个人尝鲜&lt;/td&gt;
&lt;td&gt;家庭自动化中心/macOS深度用户&lt;/td&gt;
&lt;td&gt;生产环境/团队协作&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;推荐度&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;⭐⭐⭐&lt;/td&gt;
&lt;td&gt;⭐⭐⭐⭐&lt;/td&gt;
&lt;td&gt;⭐⭐⭐⭐⭐&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;&lt;strong&gt;快速选择建议&lt;/strong&gt;：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;想先试试？→ 本地部署&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;有闲置 Mac Mini，或想要深度集成mac os系统能力？&lt;/strong&gt; → Mac Mini 方案（macOS 支持最完善）&lt;/li&gt;
&lt;li&gt;需要稳定在线→ 云服务器部署（推荐）&lt;/li&gt;
&lt;li&gt;需要傻瓜式安装 -&amp;gt; 云服务器部署（阿里云，腾讯云，百度云推出的一键安装服务器）&lt;/li&gt;
&lt;/ul&gt;
&lt;h3&gt;
  
  
  2.2 云服务器部署（推荐）
&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;适用人群&lt;/strong&gt;：需要 7×24h 在线、团队协作、稳定对外服务、IM 机器人接入&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;核心优势&lt;/strong&gt;：&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;优势&lt;/th&gt;
&lt;th&gt;实际表现&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;7×24h 在线&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;服务器不关，随时响应消息，真正做到"随时待命"&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;独立公网 IP&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;IM 平台 webhook 回调无障碍，企业微信/钉钉/飞书轻松接入&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;海外直连&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;部署海外服务器，直连google / youtube / x 等&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;数据隔离&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;AI Agent 与个人电脑分离，操作失误不会损坏本地数据&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;免维护&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;云平台托管硬件，无需担心电源、散热、硬件故障&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;&lt;strong&gt;部署模式对比&lt;/strong&gt;：&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;模式&lt;/th&gt;
&lt;th&gt;难度&lt;/th&gt;
&lt;th&gt;成本&lt;/th&gt;
&lt;th&gt;可控性&lt;/th&gt;
&lt;th&gt;维护负担&lt;/th&gt;
&lt;th&gt;推荐度&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;云厂商一键镜像&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;低&lt;/td&gt;
&lt;td&gt;中等&lt;/td&gt;
&lt;td&gt;低&lt;/td&gt;
&lt;td&gt;最低&lt;/td&gt;
&lt;td&gt;⭐⭐⭐⭐&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;自购 VPS + 手动部署&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;中等&lt;/td&gt;
&lt;td&gt;较低&lt;/td&gt;
&lt;td&gt;高&lt;/td&gt;
&lt;td&gt;中等&lt;/td&gt;
&lt;td&gt;⭐⭐⭐⭐⭐&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;&lt;strong&gt;各模式详解&lt;/strong&gt;：&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;一键镜像模式&lt;/strong&gt;：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;适合：技术小白、快速体验&lt;/li&gt;
&lt;li&gt;优点：5 分钟上线，预配置完成&lt;/li&gt;
&lt;li&gt;缺点：镜像更新滞后，自定义受限&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;手动部署模式&lt;/strong&gt;：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;适合：有一定 Linux 基础的用户&lt;/li&gt;
&lt;li&gt;优点：完全可控，可随时升级、优化&lt;/li&gt;
&lt;li&gt;缺点：需要自行处理安装、配置、维护&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;选型建议&lt;/strong&gt;：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;新手尝鲜&lt;/strong&gt;：云厂商一键镜像（零配置，开箱即用）&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;长期稳定&lt;/strong&gt;：自购 VPS 手动部署（成本可控，自由度高）&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;注意事项&lt;/strong&gt;：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;选择 &lt;strong&gt;2核2G 及以上配置&lt;/strong&gt;  需配置 Swap， 2核4G更从容&lt;/li&gt;
&lt;/ul&gt;
&lt;h3&gt;
  
  
  2.3 如何选择？决策指南
&lt;/h3&gt;

&lt;p&gt;根据你的实际情况，按以下优先级选择：&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;第一步：确定在线时长需求&lt;/strong&gt;&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;你的需求&lt;/th&gt;
&lt;th&gt;推荐方案&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;仅需偶尔使用，不要求随时响应&lt;/td&gt;
&lt;td&gt;本地部署&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;需要 7×24h 在线，随时响应消息&lt;/td&gt;
&lt;td&gt;云服务器或 Mac Mini&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;&lt;strong&gt;第二步：评估技术能力&lt;/strong&gt;&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;你的能力&lt;/th&gt;
&lt;th&gt;推荐方案&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;不熟悉 Linux，想快速体验&lt;/td&gt;
&lt;td&gt;云服务器一键镜像&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;有一定 Linux 基础，愿意折腾&lt;/td&gt;
&lt;td&gt;云服务器手动部署 或 Mac Mini&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;开发者，需要深度定制&lt;/td&gt;
&lt;td&gt;本地部署 或 云服务器手动部署&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;海外网络访问需求&lt;/td&gt;
&lt;td&gt;海外云服务器&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;&lt;strong&gt;第三步：考虑预算&lt;/strong&gt;&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;预算情况&lt;/th&gt;
&lt;th&gt;推荐方案&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;零预算，利用现有设备&lt;/td&gt;
&lt;td&gt;本地部署 / 免费云服务&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;较低预算（年费百元内）&lt;/td&gt;
&lt;td&gt;云服务器入门配置&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;中等预算，已有闲置 Mac Mini&lt;/td&gt;
&lt;td&gt;Mac Mini 方案&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;预算充足，追求稳定&lt;/td&gt;
&lt;td&gt;云服务器中高配&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;✅ &lt;strong&gt;理性选择建议&lt;/strong&gt;：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;首次体验 → 云服务器一键镜像（低成本试错）&lt;/li&gt;
&lt;li&gt;长期使用 + 需要 IM 机器人 → 云服务器手动部署（性价比最高）&lt;/li&gt;
&lt;li&gt;隐私敏感 + 已有设备 → 本地部署 或 Mac Mini&lt;/li&gt;
&lt;/ul&gt;
&lt;h2&gt;
  
  
  第三部分：云厂商 OpenClaw 方案详解
&lt;/h2&gt;

&lt;p&gt;2026 年初，国内云厂商纷纷推出 OpenClaw 相关服务。以下是主流方案的详细对比：&lt;/p&gt;
&lt;h3&gt;
  
  
  云厂商方案总览对比
&lt;/h3&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;厂商&lt;/th&gt;
&lt;th&gt;入门价格&lt;/th&gt;
&lt;th&gt;推荐配置&lt;/th&gt;
&lt;th&gt;部署方式&lt;/th&gt;
&lt;th&gt;OpenClaw专属镜像&lt;/th&gt;
&lt;th&gt;特点&lt;/th&gt;
&lt;th&gt;适合人群&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;阿里云&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;较低&lt;br&gt;（68元/年）&lt;/td&gt;
&lt;td&gt;2核2G200M+40G&lt;/td&gt;
&lt;td&gt;一键镜像&lt;/td&gt;
&lt;td&gt;✅ 预装OpenClaw&lt;/td&gt;
&lt;td&gt;支持海外，性价比高&lt;/td&gt;
&lt;td&gt;长期稳定使用&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;腾讯云&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;较低&lt;br&gt;（99元/年）&lt;/td&gt;
&lt;td&gt;2核2G50M+50G&lt;/td&gt;
&lt;td&gt;一键镜像&lt;/td&gt;
&lt;td&gt;✅ 预装OpenClaw&lt;/td&gt;
&lt;td&gt;支持海外，IM接入最全&lt;/td&gt;
&lt;td&gt;需要全平台IM接入&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;百度云&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;极低&lt;br&gt;（0.01元首月）&lt;/td&gt;
&lt;td&gt;2核4G5M+200G&lt;/td&gt;
&lt;td&gt;一键镜像&lt;/td&gt;
&lt;td&gt;✅ 预装OpenClaw&lt;/td&gt;
&lt;td&gt;限时活动，配置大方&lt;/td&gt;
&lt;td&gt;零成本尝鲜&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;AWS&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;免费&lt;br&gt;（半年+100$额度）&lt;/td&gt;
&lt;td&gt;2核2G（t3.small）&lt;/td&gt;
&lt;td&gt;手动部署&lt;/td&gt;
&lt;td&gt;❌ 需自行安装&lt;/td&gt;
&lt;td&gt;可定制性强，海外原生&lt;/td&gt;
&lt;td&gt;有国际信用卡，爱折腾&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;&lt;strong&gt;各厂商核心优势一句话总结&lt;/strong&gt;：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;🥇 &lt;strong&gt;阿里云&lt;/strong&gt;：价格最低（68元/年），预装OpenClaw镜像，支持海外地域&lt;/li&gt;
&lt;li&gt;🥈 &lt;strong&gt;腾讯云&lt;/strong&gt;：99元/年，预装最新版OpenClaw（2026.2.3-1），支持QQ/企业微信/钉钉/飞书全接入&lt;/li&gt;
&lt;li&gt;🥉 &lt;strong&gt;百度云&lt;/strong&gt;：真正的"穷鬼套餐"，0.01元白嫖一个月，2核4G配置大方，适合临时尝鲜&lt;/li&gt;
&lt;li&gt;🌐 &lt;strong&gt;AWS&lt;/strong&gt;：半年免费+100$额度，可定制性强，爱折腾用户首选&lt;/li&gt;
&lt;/ul&gt;
&lt;h3&gt;
  
  
  3.1 阿里云（68 元/年）
&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;阿里云轻量应用服务器 OpenClaw 镜像&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;价格：轻量服务器 68 元/年（如果不是新用户，可能79元）&lt;/li&gt;
&lt;li&gt;配置：2核2G / 200M 峰值带宽 / 40GB ESSD&lt;/li&gt;
&lt;li&gt;特点：预装 OpenClaw 镜像，一键启动&lt;/li&gt;
&lt;li&gt;地域：支持海外&lt;/li&gt;
&lt;li&gt;链接：&lt;a href="https://www.aliyun.com/activity/ecs/clawdbot?userCode=bu3b1wdt" rel="noopener noreferrer"&gt;轻量应用服务器 2核2G OpenClaw 镜像&lt;/a&gt;
&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fusc4mpwfz5v8drn8zpz0.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fusc4mpwfz5v8drn8zpz0.webp" alt="buy_config_detail"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;其他配置： &lt;a href="https://cn.aliyun.com/minisite/goods?from_alibabacloud=&amp;amp;userCode=bu3b1wdt" rel="noopener noreferrer"&gt;更多配置&lt;/a&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;没有预装openclaw&lt;/li&gt;
&lt;li&gt;8.5折优惠&lt;/li&gt;
&lt;/ul&gt;
&lt;h3&gt;
  
  
  3.2 腾讯云(99 元/年)
&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;腾讯云轻量应用服务器 OpenClaw 镜像&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;价格：2核2G轻量服务器 99 元/年&lt;/li&gt;
&lt;li&gt;配置：2核2G / 50M 带宽 / 50GB SSD&lt;/li&gt;
&lt;li&gt;特点：预装 OpenClaw 镜像最新版（2026.2.3-1），支持接入qq / 企业微信/ 钉钉/飞书&lt;/li&gt;
&lt;li&gt;地域：支持海外&lt;/li&gt;
&lt;li&gt;链接：&lt;a href="https://cloud.tencent.com/act/cps/redirect?redirect=37945&amp;amp;cps_key=342f7a3d9f65d3a8fdfe7e5d7199137a" rel="noopener noreferrer"&gt;轻量应用服务器 2核2G OpenClaw 镜像&lt;/a&gt;
&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;注意：选择的时候参考下图选择左上方99元的，不要选择左下22元的，那个是按月收费的。想要更高配置可以选择2核4G的。&lt;br&gt;
&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fctm9m6vun0xquodvxg81.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fctm9m6vun0xquodvxg81.webp" alt="tencent-yun"&gt;&lt;/a&gt;&lt;/p&gt;
&lt;h3&gt;
  
  
  3.3 百度云智能云（0.01元/首月）
&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;活动详情&lt;/strong&gt;：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;价格：0.01 元（四舍五入等于白送）,为期一个月&lt;/li&gt;
&lt;li&gt;配置: 2核 CPU / 4GB 内存 / 200GB 硬盘&lt;/li&gt;
&lt;li&gt;每日限量：500 台，先到先得&lt;/li&gt;
&lt;li&gt;特点：真正的"穷鬼套餐"，首月几乎免费；配置大方（2核4G+200G）；但是时效性较短&lt;/li&gt;
&lt;li&gt;地域：不支持海外&lt;/li&gt;
&lt;li&gt;链接： &lt;a href="https://cloud.baidu.com/product/BCC/moltbot.html?ambassadorId=16b2d48964e6470a83e286cd104f0bed" rel="noopener noreferrer"&gt;百度智能云 OpenClaw 服务&lt;/a&gt;
&lt;/li&gt;
&lt;/ul&gt;
&lt;h3&gt;
  
  
  3.4 AWS 云(半年免费，赠送100$m)
&lt;/h3&gt;

&lt;p&gt;AWS 没有专门推出绑定openclaw的镜像服务，但是它有限时半年的免费计划，新注册用户能获得100-200美金的额度，在半年内随便霍霍。免费期过后如果你不续费账户会被删除。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fi6k8fg5xwh9p75t1fdnd.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fi6k8fg5xwh9p75t1fdnd.webp" alt="aws-free-tier"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;AWS免费计划，虽然只有半年，但是可定制性很强，原生支持海外地域，即便不是部署openclaw，当一个普通的免费云服务也不错。不过只能创建一个服务器，如果额度提前花完，若不续费则会提前关闭账户。&lt;/p&gt;

&lt;p&gt;注意事项：&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;免费额度只有半年时效&lt;/li&gt;
&lt;li&gt;账号注册过程中需要信用卡1$扣款验证，后面会返回&lt;/li&gt;
&lt;li&gt;服务器没有openclaw绑定，需要自己安装&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;如果爱折腾，可以按下面步骤创建服务器&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;创建服务器&lt;/strong&gt;&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;访问&lt;a href="https://aws.amazon.com/free/" rel="noopener noreferrer"&gt;https://aws.amazon.com/free/&lt;/a&gt; 并创建账号&lt;/li&gt;
&lt;li&gt;参考下图

&lt;ul&gt;
&lt;li&gt;切换到 EC2创建实例页面&lt;/li&gt;
&lt;li&gt;右上角切换地域，这个就是接下来要创建的服务器的地域&lt;/li&gt;
&lt;li&gt;接着给服务器起一个名字&lt;/li&gt;
&lt;li&gt;下面选择镜像，比如Ubuntu&lt;/li&gt;
&lt;li&gt;选择镜像版本，比如Ubuntu Server 24.04&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fyoge6g15rsjqn473184h.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fyoge6g15rsjqn473184h.webp" alt="aws-free-tier-step1"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;页面往下滑继续配置实例

&lt;ul&gt;
&lt;li&gt;instance type里面选择硬件规格，推荐选择t3.small 2c2g&lt;/li&gt;
&lt;li&gt;key pais是ssh远程连接时候的密钥配置，会创建一个公钥pem文件，记得保存&lt;/li&gt;
&lt;li&gt;network settings里面把下面的三个allow都打开&lt;/li&gt;
&lt;li&gt;最下方的硬盘配置改为30G，直接拉满（免费方案最多30G）&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fpnw5sd3hs2yf2ik4wjn0.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fpnw5sd3hs2yf2ik4wjn0.webp" alt="aws-free-tier-step2"&gt;&lt;/a&gt;&lt;/p&gt;
&lt;h3&gt;
  
  
  3.5 其他云厂商
&lt;/h3&gt;

&lt;p&gt;下面的这些，要么太贵了，要么注册门槛太高，就不推荐在这些平台上折腾openclaw了。&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;厂商&lt;/th&gt;
&lt;th&gt;方案&lt;/th&gt;
&lt;th&gt;价格&lt;/th&gt;
&lt;th&gt;适合人群&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;Google Cloud&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;e2-micro 免费 tier&lt;/td&gt;
&lt;td&gt;永久免费（有限额）&lt;/td&gt;
&lt;td&gt;技术爱好者&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;Oracle Cloud&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Always Free 套餐&lt;/td&gt;
&lt;td&gt;永久免费（2核1G）&lt;/td&gt;
&lt;td&gt;真正穷鬼&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;Vultr&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;按小时计费&lt;/td&gt;
&lt;td&gt;$5/月起&lt;/td&gt;
&lt;td&gt;需要灵活计费&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;DigitalOcean&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Droplet&lt;/td&gt;
&lt;td&gt;$6/月起&lt;/td&gt;
&lt;td&gt;开发者友好&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;&lt;strong&gt;Oracle Cloud 特别说明&lt;/strong&gt;：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;永久免费套餐包含 2 台 1核1G 的 ARM 实例（合计 4核24G 内存池）&lt;/li&gt;
&lt;li&gt;技术上可以跑 OpenClaw，但注册需要国际信用卡，账号容易被回收&lt;/li&gt;
&lt;li&gt;不太容易注册成功，邮箱经常收不到邮件&lt;/li&gt;
&lt;li&gt;适合有海外资源的技术用户&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;Google Cloud特别说明&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;永久免费包含一台2核1G的虚拟机&lt;/li&gt;
&lt;li&gt;注册复杂，配置繁琐，一不小心就会扣费&lt;/li&gt;
&lt;li&gt;跑openclaw 内存有点吃力&lt;/li&gt;
&lt;li&gt;(但是！！google cloud的ip很干净，可当作一个免费海外代理服务器，可无忧访问gemini/claude/chatgpt，后面我单独出一篇注册教程)&lt;/li&gt;
&lt;/ul&gt;
&lt;h3&gt;
  
  
  3.6 该怎么选
&lt;/h3&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;个人情况&lt;/th&gt;
&lt;th&gt;推荐方案&lt;/th&gt;
&lt;th&gt;说明&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;追求最低成本，长期稳定使用&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;
&lt;strong&gt;阿里云&lt;/strong&gt;（68元/年）&lt;/td&gt;
&lt;td&gt;三家中价格最低，预装OpenClaw，支持海外&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;需要最全IM接入（QQ/企业微信/钉钉/飞书）&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;
&lt;strong&gt;腾讯云&lt;/strong&gt;（99元/年）&lt;/td&gt;
&lt;td&gt;预装最新版OpenClaw（2026.2.3-1），国内IM支持最完善&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;只想零成本尝鲜&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;
&lt;strong&gt;百度云&lt;/strong&gt;（0.01元首月）&lt;/td&gt;
&lt;td&gt;限时活动，2核4G配置最大方，适合短期体验&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;需要免费海外服务器，愿意折腾&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;
&lt;strong&gt;AWS&lt;/strong&gt;（半年免费+100$额度）&lt;/td&gt;
&lt;td&gt;可定制性强，免费期后可当海外代理用&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;需要更高配置（2核4G以上）&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;阿里云/腾讯云更高配&lt;/td&gt;
&lt;td&gt;根据预算选择&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;
&lt;h2&gt;
  
  
  第四部分：Linux 云服务器从零部署教程
&lt;/h2&gt;

&lt;p&gt;本部分以aws一台linux裸机服务器为例，完整演示从连接服务器到 OpenClaw 运行的全过程。&lt;/p&gt;

&lt;p&gt;阿里云和腾讯云以及百度云这类预装镜像的，可以不用这么折腾。或者你可以在其官网重置为ubuntu镜像，这样还原之后自己再安装&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;前提条件&lt;/strong&gt;：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;已购买云服务器（建议 2核2G 以上配置）&lt;/li&gt;
&lt;li&gt;已获取 SSH 密钥（PEM 文件）&lt;/li&gt;
&lt;li&gt;本教程在ubuntu/windows wsl上使用，如果是其它系统，可以安装对应ssh指令&lt;/li&gt;
&lt;/ul&gt;
&lt;h3&gt;
  
  
  4.1 服务器初始化
&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;第一步：本地修改 PEM 文件权限&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;SSH 对密钥文件权限要求严格，必须设置为只读：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;&lt;span class="nb"&gt;chmod &lt;/span&gt;600 ~/Downloads/pub.pem
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;strong&gt;第二步：连接服务器&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;以下命令是在本地机器上运行&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;&lt;span class="c"&gt;# 阿里云轻量应用服务器的默认用户名是 `root`&lt;/span&gt;
ssh &lt;span class="nt"&gt;-i&lt;/span&gt; ~/Downloads/pub.pem root@你的服务器公网IP

&lt;span class="c"&gt;# aws 默认是用户名是ubuntu&lt;/span&gt;
ssh &lt;span class="nt"&gt;-i&lt;/span&gt; ~/Downloads/pub.pem ubuntu@你的服务器公网IP
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;strong&gt;第三步：简化 SSH 配置（推荐）&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;创建 SSH 配置文件，避免每次输入长命令：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;vim ~/.ssh/config
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;添加以下内容：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight ssh"&gt;&lt;code&gt;&lt;span class="k"&gt;Host&lt;/span&gt; openclaw
    &lt;span class="k"&gt;HostName&lt;/span&gt; &amp;lt;服务器公网IP&amp;gt;
    &lt;span class="k"&gt;User&lt;/span&gt; &amp;lt;用户名&amp;gt;
    &lt;span class="k"&gt;IdentityFile&lt;/span&gt; ~/Downloads/pub.pem
    &lt;span class="k"&gt;StrictHostKeyChecking&lt;/span&gt; &lt;span class="no"&gt;no&lt;/span&gt;
    &lt;span class="k"&gt;UserKnownHostsFile&lt;/span&gt;=/dev/null
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;保存后，以后只需输入：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;ssh openclaw
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h3&gt;
  
  
  4.2 系统环境准备
&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;第一步：创建非 root 用户（安全最佳实践/aws不需要，已有ubuntu用户）&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;以 root 身份登录后执行：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;&lt;span class="c"&gt;# 创建用户（adduser 比 useradd 更友好）&lt;/span&gt;
&lt;span class="nb"&gt;sudo &lt;/span&gt;adduser claw

&lt;span class="c"&gt;# 添加到 sudo 组&lt;/span&gt;
&lt;span class="nb"&gt;sudo &lt;/span&gt;usermod &lt;span class="nt"&gt;-aG&lt;/span&gt; &lt;span class="nb"&gt;sudo &lt;/span&gt;claw
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;设置密码后，切换到新用户：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;su - claw
&lt;span class="nb"&gt;sudo whoami&lt;/span&gt;  &lt;span class="c"&gt;# 验证 sudo 权限，应返回 root&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;strong&gt;第二步：配置 Swap 内存（关键步骤）&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;2GB 内存直接安装 OpenClaw 可能因内存不足而卡死，建议配置 Swap。以下是创建 4GB Swap 的完整流程（Swap 大小建议为内存的 1-2 倍）：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;&lt;span class="c"&gt;# 1. 创建 Swap 文件&lt;/span&gt;
fallocate &lt;span class="nt"&gt;-l&lt;/span&gt; 4G ~/swapfile
&lt;span class="nb"&gt;chmod &lt;/span&gt;600 ~/swapfile
&lt;span class="nb"&gt;sudo &lt;/span&gt;mkswap ~/swapfile

&lt;span class="c"&gt;# 2. 永久添加到 fstab&lt;/span&gt;
&lt;span class="nb"&gt;echo&lt;/span&gt; &lt;span class="s2"&gt;"&lt;/span&gt;&lt;span class="nv"&gt;$HOME&lt;/span&gt;&lt;span class="s2"&gt;/swapfile none swap sw 0 0"&lt;/span&gt; | &lt;span class="nb"&gt;sudo tee&lt;/span&gt; &lt;span class="nt"&gt;-a&lt;/span&gt; /etc/fstab

&lt;span class="c"&gt;# 3. 激活 Swap&lt;/span&gt;
&lt;span class="nb"&gt;sudo &lt;/span&gt;swapon &lt;span class="nt"&gt;--all&lt;/span&gt;

&lt;span class="c"&gt;# 4. 验证&lt;/span&gt;
free &lt;span class="nt"&gt;-h&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;输出示例：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;              total        used        free      shared  buff/cache   available
Mem:          1.9Gi       234Mi       1.2Gi       1.0Mi       512Mi       1.5Gi
Swap:         4.0Gi          0B       4.0Gi
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;blockquote&gt;
&lt;p&gt;&lt;strong&gt;提示&lt;/strong&gt;：如果安装过程中仍然内存不足，可创建更大的 Swap（如 8GB），或考虑升级到 4GB 内存的服务器。&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;&lt;strong&gt;第三步：安装 Node.js 环境&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;OpenClaw 要求 Node.js 22+，使用 nvm 管理版本：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;&lt;span class="c"&gt;# 安装 nvm&lt;/span&gt;
curl &lt;span class="nt"&gt;-o-&lt;/span&gt; https://raw.githubusercontent.com/nvm-sh/nvm/v0.40.4/install.sh | bash
&lt;span class="nb"&gt;source&lt;/span&gt; ~/.bashrc

&lt;span class="c"&gt;# 安装 Node.js&lt;/span&gt;
nvm &lt;span class="nb"&gt;install &lt;/span&gt;node

&lt;span class="c"&gt;# 验证&lt;/span&gt;
node &lt;span class="nt"&gt;--version&lt;/span&gt;  &lt;span class="c"&gt;# v22.x.x&lt;/span&gt;

&lt;span class="c"&gt;# 安装 pnpm（更快的包管理器）&lt;/span&gt;
&lt;span class="c"&gt;# npm install -g pnpm&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h3&gt;
  
  
  4.3 OpenClaw 安装
&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;方式一：一键脚本安装（推荐新手）&lt;/strong&gt;&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;curl &lt;span class="nt"&gt;-fsSL&lt;/span&gt; https://openclaw.ai/install.sh | bash
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;如果卡住或失败，改用 npm 安装。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;方式二：npm/pnpm 安装（更可控）&lt;/strong&gt;&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;&lt;span class="c"&gt;# npm 安装&lt;/span&gt;
npm &lt;span class="nb"&gt;install&lt;/span&gt; &lt;span class="nt"&gt;-g&lt;/span&gt; openclaw@latest

&lt;span class="c"&gt;# 或 pnpm 安装（推荐，更快） &lt;/span&gt;
&lt;span class="c"&gt;# pnpm add -g openclaw@latest&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h3&gt;
  
  
  4.4 配置与启动
&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;第一步：初始化配置&lt;/strong&gt;&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;openclaw onboard &lt;span class="nt"&gt;--install-daemon&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;按提示完成：&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;选择 Onboarding mode：QuickStart&lt;/li&gt;
&lt;li&gt;选择 Model provider。如果想要免费尝鲜，可以使用opencode的  kimi-k2.5-free 节点。 免费，但是速率限制比较严重，适合轻度体验。&lt;/li&gt;
&lt;li&gt;选择channel：  Feishu (Lark Open Platform)。 最新版openclaw官方已经支持连接feishu了。&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;其它的按需选择就可以了。&lt;/p&gt;

&lt;h3&gt;
  
  
  4.5 常见问题与解决
&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;问题 1：npm install 卡死/无响应&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;原因：内存不足，OOM 导致系统假死。&lt;/p&gt;

&lt;p&gt;解决：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;检查 Swap 是否配置正确：&lt;code&gt;free -h&lt;/code&gt;
&lt;/li&gt;
&lt;li&gt;关闭其他占用内存的进程&lt;/li&gt;
&lt;li&gt;使用 pnpm 代替 npm（内存占用更低）&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;问题 2：libatomic.so.1 缺失错误&lt;/strong&gt;&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;node: error while loading shared libraries: libatomic.so.1: cannot open shared object file
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;解决：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;&lt;span class="nb"&gt;sudo &lt;/span&gt;apt &lt;span class="nb"&gt;install&lt;/span&gt; &lt;span class="nt"&gt;-y&lt;/span&gt; libatomic1
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;strong&gt;问题 3：SSH 连接提示权限错误&lt;/strong&gt;&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;Permissions 0644 for 'xxx.pem' are too open
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;解决：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;&lt;span class="nb"&gt;chmod &lt;/span&gt;600 ~/Downloads/your-key.pem
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h2&gt;
  
  
  第五部分：飞书接入
&lt;/h2&gt;

&lt;p&gt;完成基础部署只是第一步，真正的价值在于将 OpenClaw 融入日常工作流。目前国内最实用的接入方式是通过飞书—— 它既支持企业级协作，又比微信更开放，且 OpenClaw 官方从 2026.2.2 版本起已原生支持飞书集成&lt;/p&gt;

&lt;h3&gt;
  
  
  5.1 版本更新与迁移
&lt;/h3&gt;

&lt;p&gt;如果要更新openclaw版本，官方建议直接重新安装：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;curl &lt;span class="nt"&gt;-fsSL&lt;/span&gt; https://openclaw.ai/install.sh | bash
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;按提示操作就可以。&lt;/p&gt;

&lt;h3&gt;
  
  
  5.2 从第三方插件迁移到官方飞书
&lt;/h3&gt;

&lt;p&gt;早前大家安装飞书是通过第三方插件，比如：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;a href="https://github.com/m1heng/clawdbot-feishu" rel="noopener noreferrer"&gt;https://github.com/m1heng/clawdbot-feishu&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="https://github.com/AlexAnys/openclaw-feishu" rel="noopener noreferrer"&gt;https://github.com/AlexAnys/openclaw-feishu&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;如果要安装官方飞书，建议先删除旧插件，再安装新的，否则会有id冲突。&lt;/p&gt;

&lt;p&gt;最方便的方式是终端直接给openclaw发指令，让它帮你删除feishu插件。&lt;/p&gt;

&lt;h3&gt;
  
  
  5.3 安装官方飞书集成
&lt;/h3&gt;

&lt;p&gt;OpenClaw 从最新版本开始原生支持飞书（国际版 Lark）接入，无需再安装第三方插件。根据你的安装状态，选择对应的配置方式：&lt;/p&gt;

&lt;p&gt;参考链接： &lt;a href="https://docs.openclaw.ai/channels/feishu#feishu" rel="noopener noreferrer"&gt;https://docs.openclaw.ai/channels/feishu#feishu&lt;/a&gt;&lt;/p&gt;

&lt;h4&gt;
  
  
  方式一：首次安装时配置
&lt;/h4&gt;

&lt;p&gt;如果你正在执行 &lt;code&gt;openclaw onboard&lt;/code&gt;，在 &lt;strong&gt;Select channel&lt;/strong&gt; 步骤直接选择 &lt;strong&gt;Feishu (Lark Open Platform)&lt;/strong&gt;，按提示输入以下信息：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;App ID&lt;/strong&gt;：飞书应用凭证中的 App ID&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;App Secret&lt;/strong&gt;：飞书应用凭证中的 App Secret
&lt;/li&gt;
&lt;/ul&gt;

&lt;h4&gt;
  
  
  方式二：已有实例添加飞书
&lt;/h4&gt;

&lt;p&gt;若已完成初始化，通过终端启动配置向导：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;openclaw config channel feishu
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;按交互提示填写飞书应用凭证。在&lt;a href="https://open.feishu.cn/app" rel="noopener noreferrer"&gt;飞书开发者平台&lt;/a&gt;创建企业自建应用，记录 &lt;code&gt;App ID&lt;/code&gt; 和 &lt;code&gt;App Secret&lt;/code&gt; 作为应用凭证。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;权限配置&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;在飞书页面的权限管理标签页，选择批量导入，复制粘贴以下内容，进行权限配置&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight json"&gt;&lt;code&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"scopes"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"tenant"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="s2"&gt;"aily:file:read"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="s2"&gt;"aily:file:write"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="s2"&gt;"application:application.app_message_stats.overview:readonly"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="s2"&gt;"application:application:self_manage"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="s2"&gt;"application:bot.menu:write"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="s2"&gt;"contact:user.employee_id:readonly"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="s2"&gt;"corehr:file:download"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="s2"&gt;"event:ip_list"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="s2"&gt;"im:chat.access_event.bot_p2p_chat:read"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="s2"&gt;"im:chat.members:bot_access"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="s2"&gt;"im:message"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="s2"&gt;"im:message.group_at_msg:readonly"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="s2"&gt;"im:message.p2p_msg:readonly"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="s2"&gt;"im:message:readonly"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="s2"&gt;"im:message:send_as_bot"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="s2"&gt;"im:resource"&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"user"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="s2"&gt;"aily:file:read"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"aily:file:write"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"im:chat.access_event.bot_p2p_chat:read"&lt;/span&gt;&lt;span class="p"&gt;]&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;strong&gt;事件订阅配置&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;配置完成后重启 Gateway 服务：&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;openclaw gateway restart
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;需要配置完以上之后再配置事件订阅方式，否则长连接按钮选不上。确认重启没有问题，选择长连接，添加&lt;code&gt;im.message.receive_v1&lt;/code&gt;事件。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;机器人配对&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;最后一步需要配对机器人。先给机器人发一条消息，它会回复你需要配对。你可以复制内容在终端发给openclaw让它帮你配对&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fy3ewae6wjv1f6qiawuqk.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fy3ewae6wjv1f6qiawuqk.webp" alt="feishu-code"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  总结
&lt;/h2&gt;

&lt;p&gt;OpenClaw 代表了 AI 从"云服务"向"个人主权"转变的趋势。通过本文的介绍，你已经掌握了从零开始部署一个 7×24h 在线 AI 助手的完整流程。&lt;/p&gt;

&lt;h3&gt;
  
  
  根据需求选择你的方案
&lt;/h3&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;你的场景&lt;/th&gt;
&lt;th&gt;推荐方案&lt;/th&gt;
&lt;th&gt;预计成本&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;零成本尝鲜&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;百度云 0.01 元活动（2核4G）&lt;/td&gt;
&lt;td&gt;首月 ¥0.01&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;个人长期使用&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;阿里云/腾讯云 99 元/年套餐&lt;/td&gt;
&lt;td&gt;年费 ¥68-99&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;团队协作&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;2核4G 以上配置 + 飞书接入&lt;/td&gt;
&lt;td&gt;年费 ¥200-500 + API 费用&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;隐私敏感型&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;本地部署或 Mac Mini&lt;/td&gt;
&lt;td&gt;一次性投入&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;海外业务需求&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;AWS 免费套餐或阿里云海外节点&lt;/td&gt;
&lt;td&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;h3&gt;
  
  
  最后的提醒
&lt;/h3&gt;

&lt;p&gt;OpenClaw 虽然强大，但仍处于快速发展阶段。正如官方文档所说："There is no perfectly secure setup"（不存在绝对安全的配置）。建议：&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;不要在生产环境直接暴露 OpenClaw 到公网&lt;/strong&gt;，除非你已经做好了完备的安全加固&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;定期检查官方更新&lt;/strong&gt;，项目迭代极快，新版本往往修复重要安全漏洞&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;谨慎授予系统权限&lt;/strong&gt;，尤其是 &lt;code&gt;shell_commands&lt;/code&gt; 和浏览器控制功能&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;现在，你已经拥有了一个真正"有手有脚"的 AI 助手。它会在服务器上静静运行，等待你的指令——无论是深夜的紧急需求，还是清晨的日程整理，它都在那里。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;下一步行动&lt;/strong&gt;：选择你的云厂商，点击对应的链接开始部署，30 分钟后，你将拥有一个 7×24h 在线的私人 AI 助理。&lt;/p&gt;

&lt;h2&gt;
  
  
  参考
&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;阿里云&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;a href="https://www.aliyun.com/activity/ecs/clawdbot?userCode=bu3b1wdt" rel="noopener noreferrer"&gt;轻量应用服务器 2核2G OpenClaw 镜像（68元/年）&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="https://cn.aliyun.com/benefit/scene/codingplan?from_alibabacloud=&amp;amp;userCode=bu3b1wdt" rel="noopener noreferrer"&gt;Coding plan&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="https://cn.aliyun.com/minisite/goods?from_alibabacloud=&amp;amp;userCode=bu3b1wdt" rel="noopener noreferrer"&gt;更多配置（8.5折优惠）&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;腾讯云&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;a href="https://cloud.tencent.com/act/cps/redirect?redirect=37945&amp;amp;cps_key=342f7a3d9f65d3a8fdfe7e5d7199137a" rel="noopener noreferrer"&gt;轻量应用服务器 2核2G OpenClaw 镜像（99元/年））&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="https://cloud.tencent.com/act/cps/redirect?redirect=38141&amp;amp;cps_key=342f7a3d9f65d3a8fdfe7e5d7199137a" rel="noopener noreferrer"&gt;coding plan&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;百度云智能云&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;a href="https://cloud.baidu.com/product/BCC/moltbot.html?ambassadorId=16b2d48964e6470a83e286cd104f0bed" rel="noopener noreferrer"&gt;OpenClaw 专属活动（0.01元首月）&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;AWS 亚马逊云&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;a href="https://aws.amazon.com/free/" rel="noopener noreferrer"&gt;免费套餐（半年免费+$100额度）&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;OpenClaw 官方资源&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;a href="https://docs.openclaw.ai/" rel="noopener noreferrer"&gt;官方文档&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="https://docs.openclaw.ai/channels/feishu" rel="noopener noreferrer"&gt;飞书接入指南&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;原文链接： &lt;a href="https://yeekal.com/notes/openclaw-vps-server-setup" rel="noopener noreferrer"&gt;https://yeekal.com/notes/openclaw-vps-server-setup&lt;/a&gt;&lt;/p&gt;

</description>
      <category>ai</category>
      <category>cloud</category>
      <category>opensource</category>
      <category>tutorial</category>
    </item>
    <item>
      <title>Creem提现到支付宝完整教程：Wise中转方案2026最新版</title>
      <dc:creator>Yang ella</dc:creator>
      <pubDate>Tue, 03 Feb 2026 12:49:08 +0000</pubDate>
      <link>https://dev.to/yang_ella_f2a3e16ccb54550/creemti-xian-dao-zhi-fu-bao-wan-zheng-jiao-cheng-wisezhong-zhuan-fang-an-2026zui-xin-ban-bpp</link>
      <guid>https://dev.to/yang_ella_f2a3e16ccb54550/creemti-xian-dao-zhi-fu-bao-wan-zheng-jiao-cheng-wisezhong-zhuan-fang-an-2026zui-xin-ban-bpp</guid>
      <description>&lt;p&gt;Creem提现到支付宝，&lt;strong&gt;99%的人会卡在这里&lt;/strong&gt;：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;❌ 直接绑支付宝 → 触发人工审核，要求提供合同/发票（大概率失败）&lt;/li&gt;
&lt;li&gt;❌ 申请香港银行卡 → 时间成本，需亲自赴港&lt;/li&gt;
&lt;li&gt;✅ &lt;strong&gt;Wise中转&lt;/strong&gt; → 免审核，1分钟到账，全程线上操作&lt;/li&gt;
&lt;/ul&gt;

&lt;blockquote&gt;
&lt;p&gt;这是我实测3次后的稳定方案，目前 Creem → Wise → 支付宝 全链路已跑通。&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Ffwk3ev1qzkjefjkbrhup.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Ffwk3ev1qzkjefjkbrhup.png" alt=" " width="800" height="411"&gt;&lt;/a&gt;&lt;br&gt;
去年5月份我写了一篇&lt;a href="https://dev.to/indie-dev/creem-alipay-overseas-payments"&gt;creem搭配支付宝搞定个人海外收款&lt;/a&gt;的文章，在&lt;a href="https://www.v2ex.com/t/1132849" rel="noopener noreferrer"&gt;v2ex&lt;/a&gt;上有挺多人回复关注这个话题。&lt;/p&gt;

&lt;p&gt;虽然当时开发的网站已经黄了，但是creem账号留下来了，也开启了我开发ai工具站的源头。&lt;/p&gt;

&lt;p&gt;后来又陆续开发了其它网站，creem上逐渐有了余额，不过第一次直接提现到支付宝由于要审核材料的原因以失败告终。&lt;/p&gt;

&lt;p&gt;这时候我才真正留意评论区里面关注能否提现成功的疑问。&lt;/p&gt;

&lt;p&gt;我在网络上上搜了一圈也没发现能成功提现的。&lt;/p&gt;

&lt;p&gt;咨询一圈下来，目前看来还是需要港卡进行提现。&lt;/p&gt;

&lt;p&gt;当时的想法是，在没有其它海外收款方式的情况下，creem 可以帮你先把流程走通，钱可以等有空办理到港卡之后再提现，这样不阻塞开发进程。&lt;/p&gt;

&lt;p&gt;不过变化总是来得很快&lt;/p&gt;

&lt;p&gt;wise国内开放注册了。 刚好评论区里有人说提现到wise成功了。&lt;/p&gt;

&lt;p&gt;于是我把这个流程跑了一遍，并且成功提现到支付宝里了，大喜！&lt;/p&gt;

&lt;p&gt;下面是具体的流程：&lt;/p&gt;

&lt;h2&gt;
  
  
  wise账号注册
&lt;/h2&gt;

&lt;p&gt;首先你需要注册一个&lt;a href="https://wise.com/invite/ihpc/yanggangg" rel="noopener noreferrer"&gt;wise账号&lt;/a&gt;。我去年注册的，当时没有截图，还没有注册的可以网上搜索一下，挺多教程的。&lt;/p&gt;

&lt;p&gt;注册完之后在页面添加&lt;code&gt;货币&lt;/code&gt;, 我们需要用到的是欧元账户，一般可以把人民币，美元，港币一起添加上。&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;Tips: 我一开始注册完是有点懵的，界面太简洁了，一时不知道怎么操作。我以为应该有添加银行卡之类的东西，但是在这里其实是按&lt;code&gt;货币&lt;/code&gt;区分的，一类货币就代表一张虚拟卡。&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;人民币，欧元，美元账户无需审核就会通过，港卡一般需要很久，我是发邮件怼他们才给我通过的港卡，这里暂且不表。&lt;/p&gt;

&lt;p&gt;在主账户找到欧元账户，点击账户id即可看到账户详情&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Falri8sotbsf817arqrm1.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Falri8sotbsf817arqrm1.webp" alt="wise欧洲账号" width="800" height="852"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;账户详情如下，包含IBAN代码，swift id，银行名称和地址，这些是在creem里面转账需要用到的详细信息&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fdf30pm90dewh88j985vt.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fdf30pm90dewh88j985vt.webp" alt="wise欧洲账号详情" width="800" height="1734"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  creem payout账号添加
&lt;/h2&gt;

&lt;blockquote&gt;
&lt;p&gt;&lt;strong&gt;操作路径&lt;/strong&gt;：Creem Dashboard → Balance → Payout Account → Update Account&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;得到wise欧元账户之后，打开creem商店，点击侧边balance里面，进入到&lt;code&gt;Payout Account&lt;/code&gt;, 点击&lt;code&gt;Update Account&lt;/code&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fzzywcgkvhmcv2czdpmvm.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fzzywcgkvhmcv2czdpmvm.webp" alt="creem-payout-step1" width="800" height="436"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;找到你要更新账户的store，点击Set up verifications（最近creem更新频繁，下图是最新版的截图）：&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F13oqw5nh2ts0gek5ey96.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F13oqw5nh2ts0gek5ey96.webp" alt="creem-payout-step2" width="800" height="596"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;根据弹窗，点击bank payout verification的&lt;code&gt;view&lt;/code&gt; 按钮，在跳转出的页面里面添加新账户&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fi51rdmxjjn0rr9nad5q0.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fi51rdmxjjn0rr9nad5q0.webp" alt="creem-payout-step3" width="800" height="565"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;根据刚才wise里面的欧元账户信息，输入国家，选择欧元货币，点击next ：&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fw1nf2nqkyegbjc4q6944.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fw1nf2nqkyegbjc4q6944.webp" alt="creem-payout-step4" width="800" height="630"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;填入IBAN代码，回车应该能自动检测出来wise账户信息。填入持有人姓名，按照上述wise账户详情里面的&lt;code&gt;名称&lt;/code&gt;填写，顺序可能跟中文姓名的拼音不太一样&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fb8ktpbyl8b0d6m3j2yvv.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fb8ktpbyl8b0d6m3j2yvv.webp" alt="creem-payout-step5" width="800" height="652"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;输入完成之后按提示点击添加付款账户就可以了. &lt;/p&gt;

&lt;p&gt;这样就把wise里的虚拟欧元账户添加到wise的付款账户上了。&lt;/p&gt;

&lt;p&gt;下一步可以回到creem余额页面，请求提现。这样在下一个提现周期creem会打到你的wise账户里面，wise绑定的邮箱会收到下面的邮件，代表wise收到款项：&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fy7s6f2m3k53csxes97ly.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fy7s6f2m3k53csxes97ly.webp" alt="creem-payout-wise" width="800" height="728"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  wise转到支付宝
&lt;/h2&gt;

&lt;p&gt;wise收到钱后就跟creem无关了，钱已经提到wise账号上了，理论上你想怎么转都行。&lt;/p&gt;

&lt;p&gt;转到支付宝的话直接在欧元账户里面点击汇款。如果是第一次汇款，会让你添加汇款人，选择人民币之后你可以点击电子钱包，关联支付宝或者微信&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fqhw1v0i9z7ao3auauh6m.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fqhw1v0i9z7ao3auauh6m.webp" alt="creem-wise-add-alipay" width="800" height="1734"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;然后就可以愉快得向支付宝转账了。过程中会问你转账原因，填写&lt;code&gt;储蓄&lt;/code&gt;就可以:&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fe5pqbr4vl97kq6rqgajd.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fe5pqbr4vl97kq6rqgajd.webp" alt="creem-wise-add-reason" width="800" height="1734"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;大概几分钟(实测不到一分钟),支付宝就会收到转账了&lt;br&gt;
&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F7gs0dd7ghi73bglopvm0.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F7gs0dd7ghi73bglopvm0.webp" alt="creem-wise-alipay" width="800" height="1734"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;至此，从creem账户到支付宝余额就这样顺利打通。&lt;/p&gt;

&lt;h2&gt;
  
  
  常见问题（FAQ）
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;为什么是wise欧元账户，其它账户行不行&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;这个我没有试过，当时因为付款一次周期15天太长了，所以没有尝试其它账号，我个人觉得美元和港元账户应该也可以&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;可以转到微信么&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;其实钱到wise里面之后，想怎么转都行。支付宝只是一个选择，微信当然也可以转。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;手续费&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;我第一次转到支付宝收款没有收手续费，后面就回收手续费，新人会有一定额度免手续费。&lt;/p&gt;

&lt;p&gt;我上面那个wise的链接，新人注册可以最高4500的免手续费汇款额度，或者直接浏览器搜wise就可以了。&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;&lt;a href="https://yeekal.com/indie-dev/creem-payout-to-alipay/" rel="noopener noreferrer"&gt;Creem提现到支付宝完整教程：Wise中转方案2026最新版 | 免港卡秒到账&lt;/a&gt;&lt;br&gt;
愿大家都能月入万刀&lt;/p&gt;
&lt;/blockquote&gt;

</description>
      <category>creem</category>
    </item>
    <item>
      <title>阿里云部署OpenClaw：79元/年搭24小时AI代理</title>
      <dc:creator>Yang ella</dc:creator>
      <pubDate>Sun, 01 Feb 2026 09:22:30 +0000</pubDate>
      <link>https://dev.to/yang_ella_f2a3e16ccb54550/a-li-yun-bu-shu-openclaw79yuan-nian-da-24xiao-shi-aidai-li-2leh</link>
      <guid>https://dev.to/yang_ella_f2a3e16ccb54550/a-li-yun-bu-shu-openclaw79yuan-nian-da-24xiao-shi-aidai-li-2leh</guid>
      <description>&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fr6wkpryxiturvxk9foib.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fr6wkpryxiturvxk9foib.png" alt=" " width="800" height="462"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;不舍得买Mac mini，又担心本地OpenClaw删库，本文教你如何低成本拥有一个7*24h云端在线专属agent。&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;openclaw因其本地化部署，7*24h在线，手机端指令交互而爆火，github star数量过去两周一路狂奔,现在已经136k star 了。&lt;/p&gt;

&lt;p&gt;不仅如此，openclaw原名Clawdbot，受迫于anthropic的压力，clawdbot改名为motlbot，不到三天，又火速改名为openclaw。三次改名又吸尽大众眼球，网友戏称为"vibe naming"&lt;/p&gt;

&lt;p&gt;你以为到此为止了么？NO, NO，NO。&lt;/p&gt;

&lt;p&gt;这两天moltbook又火爆社交媒体，一个只有ai agent，没有任何人类发言的类reddit论坛。截至目前（2026-02-01），150万agent创建了1万多个话题，5万多发帖，23万条评论。里面有ai向ai的求助，有ai之间的协作讨论，甚至出现了ai自己的哲学和布道师，让屏幕前的人类看得目瞪口呆。这个5天前刚注册的网站，在一个一个的帖子里面，似乎隐藏着ai意识的觉醒？&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fes2tu4sqy507bmhhb07g.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fes2tu4sqy507bmhhb07g.webp" width="800" height="422"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;说到这，这一切的一切，如果要想参与进来，我们首先要有一个openclaw agent。&lt;/p&gt;

&lt;p&gt;openclaw的本质可以理解为一个跑在电脑上的软件，所以可以用自己的电脑跑，也可以跑在云端主机里面。为了安全，防止openclaw误删重要文件，很多人选择云端主机部署。&lt;/p&gt;

&lt;p&gt;不少云厂商已经开始支持openclaw，比如国内的阿里云和腾讯云。&lt;/p&gt;

&lt;p&gt;云端主机有一个好处就是他们的镜像已经帮我打包了很多功能设置，我们只需要傻瓜式操作就好了。当然简便快捷也意味着自定义就会比较麻烦一丢丢。&lt;/p&gt;

&lt;p&gt;如果你想让openclaw操作的应用或者访问的网络需要外网支持，那云主机还有一个好处是你可以选择海外服务器，这相比于个人本地部署在网络上就会方便很多。&lt;/p&gt;

&lt;p&gt;我把两家的openclaw最基础款，打折最狠的2核/2G的规格和价格都列在下表里面了。&lt;/p&gt;

&lt;p&gt;表格的对比很清晰，我果断选择了阿里云的方案。虽然腾讯云的系统盘大了10个G，但是40G系统盘对纯文本任务也够用。如果需要频繁下载大文件或运行Docker，可再考虑其它大硬盘方案"&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;云厂商&lt;/th&gt;
&lt;th&gt;主机规格&lt;/th&gt;
&lt;th&gt;价格&lt;/th&gt;
&lt;th&gt;链接&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;阿里云&lt;/td&gt;
&lt;td&gt;CPU：2核  内存：2G  系统盘：40G&lt;/td&gt;
&lt;td&gt;79￥/年&lt;/td&gt;
&lt;td&gt;&lt;a href="https://www.aliyun.com/activity/ecs/clawdbot?source=5176.29345612&amp;amp;userCode=bu3b1wdt" rel="noopener noreferrer"&gt;OpenClaw&lt;/a&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;腾讯云&lt;/td&gt;
&lt;td&gt;CPU：2核  内存：2G  系统盘：50G&lt;/td&gt;
&lt;td&gt;99￥/年&lt;/td&gt;
&lt;td&gt;&lt;a href="https://cloud.tencent.com/act/cps/redirect?redirect=37945&amp;amp;cps_key=342f7a3d9f65d3a8fdfe7e5d7199137a" rel="noopener noreferrer"&gt;OpenClaw&lt;/a&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;h2&gt;
  
  
  阿里云部署OpenClaw
&lt;/h2&gt;

&lt;p&gt;在阿里云部署OpenClaw，我们需要准备两样东西&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;云主机&lt;/li&gt;
&lt;li&gt;大模型api-key&lt;/li&gt;
&lt;/ul&gt;

&lt;blockquote&gt;
&lt;p&gt;⚠️ &lt;strong&gt;安全提醒&lt;/strong&gt;：本文涉及3处敏感信息（服务器IP、Gateway Token、api key），请妥善保管。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;本文包含阿里云/腾讯云推广链接，购买可能为作者带来佣金，不影响价格透明性与推荐独立性。*&lt;/li&gt;
&lt;/ul&gt;
&lt;/blockquote&gt;

&lt;h2&gt;
  
  
  云主机
&lt;/h2&gt;

&lt;p&gt;访问&lt;a href="https://www.aliyun.com/activity/ecs/clawdbot?userCode=bu3b1wdt" rel="noopener noreferrer"&gt;OpenClaw轻量套餐&lt;/a&gt;, 点击&lt;code&gt;一键购买并部署&lt;/code&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F8gh6xm9qcpyj1041sgz0.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F8gh6xm9qcpyj1041sgz0.webp" alt="aliyun-openclaw-click" width="800" height="384"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;网站滑动到最下端，可以看到新人折扣价79，原年费672,将近1折.这种优惠一个人只能买一次，时长一年。点击立即购买&lt;br&gt;
&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fbf713jfovxhzywkdsz0i.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fbf713jfovxhzywkdsz0i.webp" alt="aliyun-openclaw-click2" width="800" height="288"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;侧面弹窗选配置。这里只需要关注&lt;code&gt;地域&lt;/code&gt;这个选项。如前所述，如果你不需要访问海外网络，选择国内节点就可以，如果需要访问海外网络，可以按我的来选，选择美国弗尼吉亚节点。其他选项不要动&lt;br&gt;
&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fusc4mpwfz5v8drn8zpz0.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fusc4mpwfz5v8drn8zpz0.webp" alt="buy_config_detail" width="800" height="1007"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;点击立即购买进入价格确认界面：&lt;br&gt;
&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fre976hs1kp5s33llntvv.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fre976hs1kp5s33llntvv.webp" alt="confirm-price" width="800" height="185"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;支付完成之后点击&lt;code&gt;进入管理控制台&lt;/code&gt;&lt;br&gt;
&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fc65dymxu9mehz964h6ky.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fc65dymxu9mehz964h6ky.webp" alt="config-panel" width="800" height="285"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;这里会显示你刚才新建的服务器。首先记录下方的ip地址中的公有ip，把这个地址放好，不要告诉别人哦。然后点击实例id进入应用详情。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fctubtuypjnj4k2c1o0j9.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fctubtuypjnj4k2c1o0j9.webp" alt="server-page" width="800" height="901"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  云主机设置
&lt;/h2&gt;

&lt;p&gt;应用详情里面已经贴心的告诉我们需要执行的步骤，我们就傻瓜式操作按顺序执行。&lt;/p&gt;

&lt;p&gt;第一步：点击一键放通，放行18789访问端口&lt;br&gt;
&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F7zsm77dow0g0v5t0copf.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F7zsm77dow0g0v5t0copf.webp" alt="application" width="800" height="248"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;第二步: 配置api key。 哎，等等，我们还没有API Key。根据弹窗提示，我们需要到百炼平台申请，完全免费，不用花钱。 点击 &lt;a href="https://t.aliyun.com/U/dY0zR9" rel="noopener noreferrer"&gt;百炼平台&lt;/a&gt;&lt;br&gt;
&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F4fnxu0au5ifxvxhcgolu.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F4fnxu0au5ifxvxhcgolu.webp" alt="step2" width="800" height="216"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;在百炼平台上点击左上方模型服务&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fmssmdjt2ys4lz1pju8n4.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fmssmdjt2ys4lz1pju8n4.webp" alt="model-service" width="800" height="328"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;点击左侧密钥管理，再点击创建api key，复制生成的api key。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fxbcajmzgfpva8mj8vn0h.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fxbcajmzgfpva8mj8vn0h.webp" alt="apikey" width="800" height="387"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;回到阿里云，把百炼平台的api key填入第二步的配置里面，完成初始化配置&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Feumebakn5pvi0bbvwcc7.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Feumebakn5pvi0bbvwcc7.webp" alt="init-config" width="800" height="245"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;第三步：点击第三步中的&lt;code&gt;执行命令&lt;/code&gt;,执行完成之后弹窗"命令执行成功"，复制网站地址(地址对外要保密)，OK了，所有准备工作已完成。&lt;br&gt;
&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F7jcub0d85089k9rgyqwb.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F7jcub0d85089k9rgyqwb.webp" alt="step3" width="800" height="153"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  访问openclaw
&lt;/h2&gt;

&lt;p&gt;访问上一步复制的地址，应该能看到openclaw的chat界面&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F8tvm8ua1fy6m1r0w1abc.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F8tvm8ua1fy6m1r0w1abc.webp" alt="openclaw-chat" width="800" height="381"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;如果界面是这样的，说明token没有设置成功&lt;br&gt;
&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fm66abklhyftpts1url68.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fm66abklhyftpts1url68.webp" alt="error-claw" width="800" height="384"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;莫慌。上述复制的网页地址，后面有一段&lt;code&gt;token=xxxxxx&lt;/code&gt;,复制token后面的数字，按下图填到gateway token里面，点击connect即可。所以这里的地址+token其实可以对你的openclaw服务进行完整的控制，注意保密。&lt;br&gt;
&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fu7js36y5ajadlmz0719a.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fu7js36y5ajadlmz0719a.webp" alt="token-input" width="800" height="335"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;tips: 推荐在config-&amp;gt;commands 里面打开&lt;code&gt;Allow Bash Chat Command&lt;/code&gt;开关，这将允许在对话框使用斜杠&lt;code&gt;/&lt;/code&gt;调用终端指令&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fwaybwf0g4rrk3sbe2037.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fwaybwf0g4rrk3sbe2037.webp" alt="commands-bash" width="800" height="305"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  openclaw 畅玩
&lt;/h2&gt;

&lt;p&gt;以上配置完成&lt;br&gt;
开始畅玩你的openclaw吧&lt;/p&gt;

&lt;p&gt;从这一刻起，你拥有了一个永不睡眠的数字员工。&lt;/p&gt;

&lt;p&gt;记得定期检查&lt;code&gt;系统监控&lt;/code&gt;页面的内存占用，79元的机器虽然便宜，但足够支撑一个7×24小时的智能Agent。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fpe3d1wiiw9g9su2fzmj9.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fpe3d1wiiw9g9su2fzmj9.webp" alt="ping" width="800" height="368"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  参考
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;&lt;a href="https://www.aliyun.com/activity/ecs/clawdbot?userCode=bu3b1wdt" rel="noopener noreferrer"&gt;阿里云OpenClaw轻量套餐&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="https://www.aliyun.com/minisite/goods?userCode=bu3b1wdt" rel="noopener noreferrer"&gt;百炼模型&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;blockquote&gt;
&lt;p&gt;关注我，后续更多openclaw玩法推荐&lt;br&gt;
原文链接： &lt;a href="https://yeekal.com/notes/openclaw-aliyun-deploy/" rel="noopener noreferrer"&gt;https://yeekal.com/notes/openclaw-aliyun-deploy/&lt;/a&gt;&lt;/p&gt;
&lt;/blockquote&gt;

</description>
      <category>agents</category>
      <category>ai</category>
      <category>cloud</category>
      <category>tutorial</category>
    </item>
    <item>
      <title>DeepSeek-OCR 2 发布</title>
      <dc:creator>Yang ella</dc:creator>
      <pubDate>Tue, 27 Jan 2026 09:52:14 +0000</pubDate>
      <link>https://dev.to/yang_ella_f2a3e16ccb54550/deepseek-ocr-2-fa-bu-5c9l</link>
      <guid>https://dev.to/yang_ella_f2a3e16ccb54550/deepseek-ocr-2-fa-bu-5c9l</guid>
      <description>&lt;p&gt;&lt;a href="https://deepseekocr.io/" rel="noopener noreferrer"&gt;在线体验 DeepSeek-OCR&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F5o5zkyxrarw2163nz0f1.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F5o5zkyxrarw2163nz0f1.png" alt=" " width="800" height="695"&gt;&lt;/a&gt;&lt;br&gt;
&lt;strong&gt;DeepSeek-OCR-2&lt;/strong&gt; 是 DeepSeek（深度求索）推出的&lt;strong&gt;第二代开源文档理解与 OCR（光学字符识别）模型&lt;/strong&gt;。&lt;/p&gt;

&lt;p&gt;相比于传统的 OCR 工具，它更像是一个专门针对文档图像的“视觉语言模型”，旨在解决复杂排版、长文档和多模态元素（如图表、公式）的解析问题。&lt;/p&gt;

&lt;p&gt;不过根据在OminiDocBench V1.5上的评测，DeepSeek-OCR-2相比DeepSeek-OCR 1代虽然有所提升（综合提升3.7%），但是在大部分任务上仍不及PaddleOCR-VL，这是2025年百度团队发布的最新的ocr模型&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Ff7je8zcq0wpcjsdlynj6.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Ff7je8zcq0wpcjsdlynj6.png" alt=" " width="800" height="631"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;LightonAI团队在几天前也发布了LightOnOCR-2模型，据称在OlmOCR基准测试中超过PaddleOCR-VL取得SOTA，大小只有1B，推理运行速度是PaddleOCR-VL的两倍，可以一试&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2For5x3hp3vjh1nzwrzyc2.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2For5x3hp3vjh1nzwrzyc2.png" alt=" " width="800" height="436"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;以下是该项目的核心总结：&lt;/p&gt;

&lt;h3&gt;
  
  
  1. 核心定位：下一代文档智能
&lt;/h3&gt;

&lt;p&gt;DeepSeek-OCR-2 不仅仅是识别文字，它的目标是&lt;strong&gt;全文档结构化理解&lt;/strong&gt;。它能够将图片形式的文档直接转换为结构清晰的 Markdown 或 JSON 格式，保留排版逻辑。&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;  &lt;strong&gt;Slogan&lt;/strong&gt;: "Visual Causal Flow" (视觉因果流) —— 旨在探索更像人类的视觉编码方式。&lt;/li&gt;
&lt;li&gt;  &lt;strong&gt;主要改进&lt;/strong&gt;: 相比第一代主要强调的“视觉Token压缩”，第二代在视觉编码的逻辑性和连贯性上做了优化，使其更符合人类阅读和理解文档的因果逻辑。&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  2. 核心技术架构
&lt;/h3&gt;

&lt;p&gt;该模型采用了独特的&lt;strong&gt;两阶段架构&lt;/strong&gt;，专门针对 LLM 的文档理解进行了优化：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;  &lt;strong&gt;Stage 1：视觉编码与压缩 (Vision Encoding)&lt;/strong&gt;

&lt;ul&gt;
&lt;li&gt;  使用混合视觉编码器（通常结合 SAM、CLIP 等技术）捕捉文档细节。&lt;/li&gt;
&lt;li&gt;  &lt;strong&gt;关键特性：高压缩率&lt;/strong&gt;。它能将高分辨率的文档图像（如 1024x1024）压缩为数量极少、语义极高的“视觉 Token”（例如仅几百个 Token）。这使得它能以极低的算力成本处理长文档。&lt;/li&gt;
&lt;/ul&gt;


&lt;/li&gt;

&lt;li&gt;  &lt;strong&gt;Stage 2：MoE 解码 (Mixture-of-Experts Decoder)&lt;/strong&gt;

&lt;ul&gt;
&lt;li&gt;  后端连接一个基于 MoE（混合专家）架构的语言模型（通常是 DeepSeek-V3/VL 的轻量化版本或专用版本），将视觉 Token 解码为文本、HTML 或 Markdown。&lt;/li&gt;
&lt;/ul&gt;


&lt;/li&gt;

&lt;/ul&gt;

&lt;h3&gt;
  
  
  3. 主要功能与优势
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;  &lt;strong&gt;复杂排版还原&lt;/strong&gt;: 能够精准识别并还原多栏排版、表格（Table）、图表（Chart）和数学公式（LaTeX 格式）。&lt;/li&gt;
&lt;li&gt;  &lt;strong&gt;结构化输出&lt;/strong&gt;: 直接输出 Markdown、HTML 或 JSON，方便后续 RAG（检索增强生成）或数据入库使用。&lt;/li&gt;
&lt;li&gt;  &lt;strong&gt;多语言支持&lt;/strong&gt;: 覆盖 100+ 种语言，包括手写体识别。&lt;/li&gt;
&lt;li&gt;  &lt;strong&gt;极高的吞吐量&lt;/strong&gt;: 得益于视觉 Token 的高压缩比，其推理速度非常快（官方数据曾提及单卡 A100 可达 20万页/天级别的吞吐量），非常适合大规模文档处理。&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  4. 部署与使用
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;  &lt;strong&gt;开源协议&lt;/strong&gt;: 允许研究与商用（需遵循 MIT 或 DeepSeek Model License）。&lt;/li&gt;
&lt;li&gt;  &lt;strong&gt;生态支持&lt;/strong&gt;:

&lt;ul&gt;
&lt;li&gt;  官方支持 &lt;strong&gt;vLLM&lt;/strong&gt; 加速推理。&lt;/li&gt;
&lt;li&gt;  提供了 HuggingFace Transformers 的原生支持。&lt;/li&gt;
&lt;li&gt;  提供了针对 PDF 和图片流式处理的 Python 脚本（&lt;code&gt;run_dpsk_ocr2_pdf.py&lt;/code&gt; 等）。&lt;/li&gt;
&lt;/ul&gt;


&lt;/li&gt;

&lt;/ul&gt;

&lt;h3&gt;
  
  
  5. 总结：为什么要用它？
&lt;/h3&gt;

&lt;p&gt;如果你需要处理的不仅仅是简单的纯文本识别，而是需要&lt;strong&gt;理解文档结构&lt;/strong&gt;（比如把一份复杂的 PDF 财报转换成干净的 Markdown，或者提取论文中的公式和图表），&lt;strong&gt;DeepSeek-OCR-2 是目前开源界最强的方案之一&lt;/strong&gt;。它在保持高精度的同时，极大地降低了 Token 的消耗，比直接使用通用的多模态大模型（如 GPT-4o 或 Claude 3.5 Sonnet）处理文档要经济高效得多。&lt;/p&gt;

&lt;p&gt;参考：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;a href="https://github.com/deepseek-ai/DeepSeek-OCR-2/" rel="noopener noreferrer"&gt;https://github.com/deepseek-ai/DeepSeek-OCR-2/&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="https://huggingface.co/lightonai/LightOnOCR-2-1B" rel="noopener noreferrer"&gt;https://huggingface.co/lightonai/LightOnOCR-2-1B&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;a href="https://deepseekocr.io/" rel="noopener noreferrer"&gt;deepseek ocr 和paddleocr vl 在线体&lt;/a&gt;&lt;/p&gt;

</description>
    </item>
    <item>
      <title>Qwen-Image-Edit-2511：人物一致性再上新台阶</title>
      <dc:creator>Yang ella</dc:creator>
      <pubDate>Sun, 28 Dec 2025 08:20:27 +0000</pubDate>
      <link>https://dev.to/yang_ella_f2a3e16ccb54550/qwen-image-edit-2511ren-wu-zhi-xing-zai-shang-xin-tai-jie-1h2</link>
      <guid>https://dev.to/yang_ella_f2a3e16ccb54550/qwen-image-edit-2511ren-wu-zhi-xing-zai-shang-xin-tai-jie-1h2</guid>
      <description>&lt;p&gt;自从 Qwen Image 系列发布以来，它凭借强大的图像生成与编辑能力在开源社区持续受到关注。在“编辑模型”路线中，&lt;strong&gt;Qwen-Image-Edit-2511&lt;/strong&gt; 是基于此前版本（如 2509）的又一次增强迭代，在人物一致性、多主体场景稳定性、编辑风格能力与空间几何理解等方面带来了更好的体验。&lt;/p&gt;

&lt;p&gt;本文将从&lt;strong&gt;产品体验与实测角度&lt;/strong&gt;出发，重点观察模型在真实编辑任务中的表现。&lt;/p&gt;

&lt;h2&gt;
  
  
  核心改进体验概览
&lt;/h2&gt;

&lt;p&gt;与此前版本相比，Qwen-Image-Edit-2511 在以下方面更具“可感知提升”：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;✅ 人物一致性显著提高
&lt;/li&gt;
&lt;li&gt;✅ 多主体场景结构更稳定
&lt;/li&gt;
&lt;li&gt;✅ 融入更多编辑与风格能力（含内置 LoRA 能力）
&lt;/li&gt;
&lt;li&gt;✅ 工业设计 &amp;amp; 空间几何推理表现更好
&lt;/li&gt;
&lt;li&gt;✅ 在线 / 本地支持体系更完善&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  🎯 人物一致性表现：更稳定、更可控
&lt;/h2&gt;

&lt;p&gt;这一版本的重点之一，是&lt;strong&gt;人物身份与特征保持能力的增强&lt;/strong&gt;。&lt;/p&gt;

&lt;p&gt;在执行以下场景时：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;更换背景
&lt;/li&gt;
&lt;li&gt;风格转换
&lt;/li&gt;
&lt;li&gt;局部服饰修改
&lt;/li&gt;
&lt;li&gt;多轮编辑叠加
&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;角色的以下特征更容易保持不变：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;面部结构与辨识度
&lt;/li&gt;
&lt;li&gt;服饰核心元素
&lt;/li&gt;
&lt;li&gt;饰品与细节轮廓
&lt;/li&gt;
&lt;li&gt;整体身份语义
&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fgxjza20ldrueqxflvsrv.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fgxjza20ldrueqxflvsrv.webp" width="800" height="426"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;在多人场景中，2511 的表现也更加稳定：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;主体区分能力更清晰
&lt;/li&gt;
&lt;li&gt;人物关系不易错位
&lt;/li&gt;
&lt;li&gt;语义整体性更强
&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fv1latyfm0twxqi839yek.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fv1latyfm0twxqi839yek.webp" width="800" height="439"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;人物的衣着、脸型、配饰等关键特征能在&lt;strong&gt;编辑操作后得到较为完整的保留&lt;/strong&gt;，减少“重新生成导致人物变形”的风险。&lt;/p&gt;

&lt;p&gt;x上有一张Qwen-Image-Edit-2511和2509的详细对比图，可以更直观地感受两个版本之间的区别：&lt;a href="https://x.com/toyxyz3/status/2004257130363474039/photo/1" rel="noopener noreferrer"&gt;source&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Frvmldcff2bqngicfoodh.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Frvmldcff2bqngicfoodh.webp" alt="Qwen-Image-Edit-2511和2509的详细对比图" width="800" height="583"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  🎨 编辑风格能力：可表达空间进一步拓展
&lt;/h2&gt;

&lt;p&gt;Qwen-Image-Edit 社区一直非常活跃，围绕该模型产生了大量基于 LoRA 的增强风格能力。本次版本的体验重点在于：&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;🔹 部分常用能力已被“原生融合到模型中”&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;这意味着在 &lt;strong&gt;不额外加载 LoRA 的情况下&lt;/strong&gt;，就能获得更丰富的风格表达能力，同时仍保持较高的编辑稳定性。&lt;/p&gt;

&lt;p&gt;例如：&lt;/p&gt;

&lt;p&gt;📍 视角变化&lt;br&gt;&lt;br&gt;
&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fe9kwecd7d7py5palgjgk.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fe9kwecd7d7py5palgjgk.webp" width="800" height="450"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;📍 打光与氛围增强&lt;br&gt;&lt;br&gt;
&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F0p5b4zydlj8ylaxwb3hy.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F0p5b4zydlj8ylaxwb3hy.webp" width="800" height="450"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;整体观感更接近“编辑 + 风格增益”，而非“风格覆盖式二次生成”&lt;/p&gt;
&lt;h2&gt;
  
  
  🏗️ 工业设计与空间理解：更强的结构意识
&lt;/h2&gt;

&lt;p&gt;在工业设计类图片上，2511 的编辑体验同样有提升，尤其体现在：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;结构形体保持能力
&lt;/li&gt;
&lt;li&gt;局部改造不破坏整体几何
&lt;/li&gt;
&lt;li&gt;对空间关系的推理更理性
&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Ft6vgsa93w09v5sjggxh7.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Ft6vgsa93w09v5sjggxh7.webp" width="800" height="320"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;以下是几何结构引导型编辑的典型提示词示例：&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Blender Wireframe 风格&lt;/strong&gt;&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight markdown"&gt;&lt;code&gt;Convert this object into a Blender-style geometric wireframe rendering.
Keep the original shape and proportions, and overlay clean 3D construction lines, edges, and wireframe mesh lines.
Do not add textures or shading — only structural geometry lines.
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;

&lt;p&gt;&lt;br&gt;
`&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;透视 / 内部结构显露&lt;/strong&gt;&lt;br&gt;
&lt;code&gt;&lt;/code&gt;&lt;code&gt;markdown&lt;br&gt;
Convert the outer shell into transparent glass and reveal the internal structural layers.&lt;br&gt;
&lt;/code&gt;&lt;code&gt;&lt;/code&gt;&lt;/p&gt;

&lt;p&gt;这类编辑更偏“空间推理 + 结构抽象”，而非单纯纹理替换，体现出模型在&lt;strong&gt;几何理解层面的小幅进化&lt;/strong&gt;。&lt;/p&gt;

&lt;h2&gt;
  
  
  在线体验入口
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;a href="https://huggingface.co/spaces/Qwen/Qwen-Image-Edit-2511" rel="noopener noreferrer"&gt;huggingface 平台&lt;/a&gt;: （偶尔失败）&lt;/li&gt;
&lt;li&gt;
&lt;a href="https://modelscope.cn/aigc/imageGeneration?tab=advanced&amp;amp;versionId=507464&amp;amp;modelType=checkpoint&amp;amp;sdVersion=QWEN_IMAGE_EDIT_2511&amp;amp;modelUrl=modelscope%3A%2F%2FQwen%2FQwen-Image-Edit-2511%3Frevision%3Dmaster" rel="noopener noreferrer"&gt;model scope&lt;/a&gt;: （有排队但每天有免费额度&lt;/li&gt;
&lt;li&gt;&lt;a href="https://chat.qwen.ai/?inputFeature=image_edit" rel="noopener noreferrer"&gt;qwen chat&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;
&lt;a href="https://t.aliyun.com/U/ufuKiX" rel="noopener noreferrer"&gt;阿里云百炼平台&lt;/a&gt;: 推荐：稳定且无需排队，适合api调用，注册可有100次免费生成机会，其他模型，比如 z-image-turbo, wan系列也有免费额度&lt;/li&gt;
&lt;li&gt;&lt;a href="https://z-image.app/models/qwen-image-edit-2511" rel="noopener noreferrer"&gt;qwen-image-edit-2511&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;注意：阿里云百炼平台上要选择Image-edit-plus，然后选择&lt;code&gt;Image-edit-plus-2025-12-15&lt;/code&gt;,才是发布的&lt;code&gt;Qwen-Image-Edit-2511&lt;/code&gt;版本。命名和发布时间着实有点混乱。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fmlutxdw3s26g6ebpc2x6.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fmlutxdw3s26g6ebpc2x6.webp" alt="阿里云百炼平台" width="800" height="404"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  本地快速开始（Diffusers）
&lt;/h2&gt;

&lt;p&gt;安装最新diffusers版本&lt;/p&gt;

&lt;p&gt;&lt;code&gt;&lt;/code&gt;`python&lt;br&gt;
pip install git+&lt;a href="https://github.com/huggingface/diffusers" rel="noopener noreferrer"&gt;https://github.com/huggingface/diffusers&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;`&lt;code&gt;&lt;/code&gt;&lt;/p&gt;

&lt;p&gt;开始使用  Qwen-Image-Edit-2511&lt;/p&gt;

&lt;p&gt;&lt;code&gt;&lt;/code&gt;`python&lt;br&gt;
import os&lt;br&gt;
import torch&lt;br&gt;
from PIL import Image&lt;br&gt;
from diffusers import QwenImageEditPlusPipeline&lt;/p&gt;

&lt;p&gt;pipeline = QwenImageEditPlusPipeline.from_pretrained("Qwen/Qwen-Image-Edit-2511", torch_dtype=torch.bfloat16)&lt;br&gt;
print("pipeline loaded")&lt;/p&gt;

&lt;p&gt;pipeline.to('cuda')&lt;br&gt;
pipeline.set_progress_bar_config(disable=None)&lt;br&gt;
image1 = Image.open("input1.png")&lt;br&gt;
image2 = Image.open("input2.png")&lt;br&gt;
prompt = "The magician bear is on the left, the alchemist bear is on the right, facing each other in the central park square."&lt;br&gt;
inputs = {&lt;br&gt;
    "image": [image1, image2],&lt;br&gt;
    "prompt": prompt,&lt;br&gt;
    "generator": torch.manual_seed(0),&lt;br&gt;
    "true_cfg_scale": 4.0,&lt;br&gt;
    "negative_prompt": " ",&lt;br&gt;
    "num_inference_steps": 40,&lt;br&gt;
    "guidance_scale": 1.0,&lt;br&gt;
    "num_images_per_prompt": 1,&lt;br&gt;
}&lt;br&gt;
with torch.inference_mode():&lt;br&gt;
    output = pipeline(**inputs)&lt;br&gt;
    output_image = output.images[0]&lt;br&gt;
    output_image.save("output_image_edit_2511.png")&lt;br&gt;
    print("image saved at", os.path.abspath("output_image_edit_2511.png"))&lt;br&gt;
`&lt;code&gt;&lt;/code&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  在本地用 ComfyUI 跑 Qwen-Image-Edit-2511
&lt;/h2&gt;

&lt;ol&gt;
&lt;li&gt;前往 &lt;strong&gt;ComfyUI 官方网站&lt;/strong&gt; 下载稳定/开发版程序。&lt;/li&gt;
&lt;/ol&gt;

&lt;ul&gt;
&lt;li&gt;官方网站提供本地安装包，也可以从 GitHub 获取源码。&lt;a href="https://www.comfy.org/download" rel="noopener noreferrer"&gt;comfy.org&lt;/a&gt;

&lt;ol&gt;
&lt;li&gt;安装完成后启动 ComfyUI，确保你使用的是&lt;strong&gt;最新版&lt;/strong&gt;或者 &lt;strong&gt;nightly（开发）版&lt;/strong&gt;，因为部分节点只有最新版本才支持。&lt;a href="https://docs.comfy.org/installation/update_comfyui" rel="noopener noreferrer"&gt;update_comfyui&lt;/a&gt;
&lt;/li&gt;
&lt;/ol&gt;
&lt;/li&gt;
&lt;/ul&gt;

&lt;blockquote&gt;
&lt;p&gt;💡 Stable 版一般较稳定，但最新节点可能暂未同步，如果工作流加载节点失败，请尝试使用 nightly 版。&lt;/p&gt;
&lt;/blockquote&gt;

&lt;h3&gt;
  
  
  下载 Qwen-Image-Edit-2511 模型文件
&lt;/h3&gt;

&lt;p&gt;ComfyUI 的工作流需要将模型文件放入指定目录中。主要需要以下几类文件：&lt;/p&gt;

&lt;p&gt;📁 &lt;strong&gt;放在 ComfyUI 根目录的 models 文件夹结构如下：&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;&lt;code&gt;&lt;/code&gt;&lt;code&gt;&lt;br&gt;
📂 ComfyUI/&lt;br&gt;
├── models/&lt;br&gt;
│   ├── text_encoders/&lt;br&gt;
│   │      └── qwen_2.5_vl_7b_fp8_scaled.safetensors&lt;br&gt;
│   ├── loras/&lt;br&gt;
│   │      └── Qwen-Image-Edit-2511-Lightning-4steps-V1.0-bf16.safetensors (可选)&lt;br&gt;
│   ├── diffusion_models/&lt;br&gt;
│   │      └── qwen_image_edit_2511_bf16.safetensors&lt;br&gt;
│   └── vae/&lt;br&gt;
│          └── qwen_image_vae.safetensors&lt;br&gt;
&lt;/code&gt;&lt;code&gt;&lt;/code&gt;&lt;/p&gt;

&lt;p&gt;📌 &lt;strong&gt;关键文件说明&lt;/strong&gt;：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;qwen_2.5_vl_7b_fp8_scaled.safetensors&lt;/strong&gt; — Qwen 图像编码器（必需）。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;qwen_image_edit_2511_bf16.safetensors&lt;/strong&gt; — 主编辑模型。&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;qwen_image_vae.safetensors&lt;/strong&gt; — VAE 模型，用于视觉空间编码&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Qwen-Image-Edit-2511-Lightning-4steps-V1.0-bf16.safetensors&lt;/strong&gt; — LoRA 加速版本（可选，可加速和增强效果）。&lt;/li&gt;
&lt;/ul&gt;

&lt;blockquote&gt;
&lt;p&gt;💡 LoRA 不是必装，但加了之后在同样步骤下能输出更丰富的细节与更快结果响应。&lt;/p&gt;
&lt;/blockquote&gt;




&lt;h3&gt;
  
  
  加载 ComfyUI 工作流
&lt;/h3&gt;

&lt;p&gt;ComfyUI 支持导入 JSON 格式的工作流模板，你可以：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;直接在 ComfyUI 主界面 &lt;strong&gt;拖入官方提供的工作流 JSON 文件&lt;/strong&gt;
&lt;/li&gt;
&lt;li&gt;或手动在左侧节点面板构建节点流程&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;官方提供了一个针对 &lt;a href="https://raw.githubusercontent.com/Comfy-Org/workflow_templates/refs/heads/main/templates/image_qwen_image_edit_2511.json" rel="noopener noreferrer"&gt;&lt;strong&gt;Qwen-Image-Edit-2511 的原生工作流 JSON&lt;/strong&gt;&lt;/a&gt; 模板，把它导入即可开始编辑任务。&lt;/p&gt;

&lt;p&gt;导入后，大致流程会包括以下节点组合：&lt;/p&gt;

&lt;p&gt;🟦 &lt;strong&gt;Input Image&lt;/strong&gt; → 🟩 &lt;strong&gt;Qwen-Image-Edit-2511 模型节点&lt;/strong&gt; → 🟧 &lt;strong&gt;Prompt 输入节点&lt;/strong&gt; → 🟨 &lt;strong&gt;Output Save / Display 节点&lt;/strong&gt;&lt;/p&gt;




&lt;h3&gt;
  
  
  配置提示词与参数
&lt;/h3&gt;

&lt;p&gt;在 Prompt 输入节点中写 &lt;strong&gt;自然语言提示词&lt;/strong&gt; 来控制编辑行为，例如：&lt;/p&gt;

&lt;p&gt;&lt;code&gt;&lt;/code&gt;&lt;code&gt;text&lt;br&gt;
Change the background to a sleek studio setup while keeping the product geometry unchanged.&lt;br&gt;
&lt;/code&gt;&lt;code&gt;&lt;/code&gt;&lt;/p&gt;

&lt;p&gt;通用建议：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;先设置“保持不变”的部分（如主体、透视、结构、阴影）&lt;/li&gt;
&lt;li&gt;再写出“想要改变”的部分（背景、材料、局部形态等）&lt;/li&gt;
&lt;li&gt;如果需要几何结构辅助线，可以注明“add thin geometric guide lines for structure”&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  📌 Tips：本地调优技巧
&lt;/h3&gt;

&lt;p&gt;🎯 &lt;strong&gt;分辨率与显存&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;分辨率设置越高消耗显存越大，建议先用 512/768 分辨率测试。&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;🛠 &lt;strong&gt;使用 Lightning 轻量模型&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Lightning LoRA 可加速编辑流程，尤其在低显存或快速迭代场景下很有用。&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;🔄 &lt;strong&gt;多图层 &amp;amp; 多输入&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;若你要做多视角合成，可在工作流中添加多个输入节点并连接到模型节点进行联合编辑。&lt;/li&gt;
&lt;/ul&gt;




&lt;h2&gt;
  
  
  🧠 一个典型工作流结构示例
&lt;/h2&gt;

&lt;p&gt;以下是一个简化版的 ComfyUI 节点流程逻辑：&lt;/p&gt;

&lt;p&gt;&lt;code&gt;&lt;/code&gt;&lt;code&gt;&lt;br&gt;
[Image Input] → [Prompt] → [Qwen-Image-Edit-2511 Model] → [Save/Display Output]&lt;br&gt;
       ↘ [Mask/Region Mask] — 引导局部编辑&lt;br&gt;
&lt;/code&gt;&lt;code&gt;&lt;/code&gt;&lt;/p&gt;

&lt;p&gt;这类结构既可以控制局部内容，又能灵活做全图修改。&lt;/p&gt;

&lt;h2&gt;
  
  
  Lightning / Light2V 优化：为更快、更轻量推理而来
&lt;/h2&gt;

&lt;p&gt;除了官方基础版的 &lt;em&gt;Qwen-Image-Edit-2511&lt;/em&gt; 之外，社区也发布了 &lt;a href="https://huggingface.co/lightx2v/Qwen-Image-Edit-2511-Lightning" rel="noopener noreferrer"&gt;&lt;strong&gt;优化版本：Qwen-Image-Edit-2511-Lightning&lt;/strong&gt;&lt;/a&gt; —— 这是一个针对编辑任务做出轻量推理优化的改进版本，依托 &lt;strong&gt;step distillation（步数蒸馏）&lt;/strong&gt; 与 &lt;strong&gt;低精度量化&lt;/strong&gt; 技术，显著提升了推理效率与资源利用表现。&lt;/p&gt;

&lt;h3&gt;
  
  
  📌 Lightning 是什么？
&lt;/h3&gt;

&lt;p&gt;&lt;em&gt;Qwen-Image-Edit-2511-Lightning&lt;/em&gt; 实际上是一套针对原版 2511 进行加速与压缩的轻量化模型组合，包括：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;4-step 蒸馏 LoRA 版本&lt;/strong&gt; —— 仅 4 步推理即可得到结果&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;FP32 精度版本&lt;/strong&gt; —— 保留较高编辑质量&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;FP8 量化版本（e4m3fn scaled）&lt;/strong&gt; —— 在显存友好与性能间寻找折中&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;这样的优化目标是：在&lt;strong&gt;减少推理步骤与显存需求&lt;/strong&gt;的同时，&lt;strong&gt;尽可能保留原始模型的编辑质量&lt;/strong&gt;。&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fzd3qmkuoi0d7xozuoh7i.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fzd3qmkuoi0d7xozuoh7i.webp" width="800" height="1046"&gt;&lt;/a&gt;&lt;br&gt;
&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fcdn.yeekal.com%2Fyee%2Fblog%2F2025-12%2Flight2v-exam2.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fcdn.yeekal.com%2Fyee%2Fblog%2F2025-12%2Flight2v-exam2.webp" width="800" height="400"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h3&gt;
  
  
  主要优化方向
&lt;/h3&gt;

&lt;p&gt;Lightning 版本的优化包括：&lt;/p&gt;

&lt;p&gt;✔️ &lt;strong&gt;4 步推理（≈10× 加速）&lt;/strong&gt;&lt;br&gt;
相比标准 40 步采样，Lightning LoRA 仅需约 4 步推理即可得到可用结果，极大提升交互体验与调参速度。&lt;/p&gt;

&lt;p&gt;✔️ &lt;strong&gt;显存 &amp;amp; 资源消耗降低&lt;/strong&gt;&lt;br&gt;
通过 FP8 量化，显存占用比 FP32 版本降低约 50%，对低显存显卡更友好。&lt;/p&gt;

&lt;p&gt;✔️ &lt;strong&gt;与 LightX2V / Qwen-Image-Lightning 兼容&lt;/strong&gt;&lt;br&gt;
可配合轻量推理框架如 LightX2V，在更宽的硬件环境上快速部署&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F9h63a5kcaz1hb57j1qoy.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F9h63a5kcaz1hb57j1qoy.webp" width="800" height="627"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h3&gt;
  
  
  🧠 什么时候使用 Lightning？
&lt;/h3&gt;

&lt;p&gt;📈 &lt;strong&gt;适合场景&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;快速迭代调参&lt;/li&gt;
&lt;li&gt;可视化工作流实时预览&lt;/li&gt;
&lt;li&gt;显存较紧张的本地编辑&lt;/li&gt;
&lt;li&gt;批量生成或自动化输出&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;🛠 &lt;strong&gt;使用体验建议&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;✔ 在 ComfyUI 或 LightX2V 环境中 &lt;strong&gt;优先选用 “4-steps” Lightning LoRA&lt;/strong&gt; 模式进行初步预览&lt;/li&gt;
&lt;li&gt;✔ 在对质量有较高要求时，可以在 Lightning 快速调参后切换到标准模型跑更高步数&lt;/li&gt;
&lt;li&gt;✔ 使用 FP8 量化版可显著降低显存压力，但极复杂的场景仍建议使用 BF16 / FP32 模式&lt;/li&gt;
&lt;li&gt;✔ 对于人物细节强依赖型任务（如人脸特写），建议尝试 Lightning LoRA + 较高步数组合观察对比效果&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;📉 &lt;strong&gt;需要注意&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Lightning LoRA 在&lt;strong&gt;极限场景下可能牺牲部分细节质量&lt;/strong&gt;（例如人脸细节、复杂纹理）对比全步长标准模型可能略有差异。部分用户反馈在某些图像上细节可能“偏模糊或轻微失真”。&lt;/li&gt;
&lt;li&gt;与单独加载 LoRA + 原模型分开运行相比，有时灵活性稍弱。&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;很好，这篇文章已经非常完整了 👍&lt;br&gt;
下面是可直接追加到文末的 &lt;strong&gt;总结段落 + 参考链接部分&lt;/strong&gt;，语言风格与整体文章保持一致，可无缝拼接。&lt;/p&gt;




&lt;h2&gt;
  
  
  总结：一次更偏“体验向”的进化升级
&lt;/h2&gt;

&lt;p&gt;相较于此前版本，&lt;strong&gt;Qwen-Image-Edit-2511 的进步并不是参数层面的“大跃迁”，而是一次非常务实、贴近真实编辑需求的产品化升级&lt;/strong&gt;：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;👤 &lt;strong&gt;人物一致性更稳定&lt;/strong&gt; —— 多轮编辑后仍能保留身份语义与关键特征&lt;/li&gt;
&lt;li&gt;🧩 &lt;strong&gt;多主体与空间关系更可靠&lt;/strong&gt; —— 不再轻易出现错位与结构破坏&lt;/li&gt;
&lt;li&gt;🎨 &lt;strong&gt;编辑能力更加内聚化&lt;/strong&gt; —— 部分风格与表达能力已原生融入模型&lt;/li&gt;
&lt;li&gt;🏗️ &lt;strong&gt;工业设计与几何推理更理性&lt;/strong&gt; —— 从“图像外观”走向“结构理解”&lt;/li&gt;
&lt;li&gt;⚡ &lt;strong&gt;Lightning / Light2V 带来更高推理效率&lt;/strong&gt; —— 轻量场景下更具工程价值&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;在实际体验中，2511 更像是将“生成模型”向“&lt;strong&gt;稳定可控的编辑工具&lt;/strong&gt;”进一步推进了一步：&lt;br&gt;
它能更好地承担 &lt;strong&gt;产品原型修改、风格变体生成、多视角一致化输出&lt;/strong&gt; 等任务，特别适合 &lt;strong&gt;设计 / 创作 / 产品验证&lt;/strong&gt; 等应用场景。&lt;/p&gt;

&lt;p&gt;对于需要 &lt;strong&gt;效率优先、本地快速部署或批量生成&lt;/strong&gt; 的用户，Lightning / Light2V 版本也是一个非常具有现实意义的补充方案。&lt;/p&gt;

&lt;p&gt;未来，如果 Qwen Image 系列继续在 &lt;strong&gt;一致性、跨视角表达与结构理解&lt;/strong&gt; 方向演进，它可能会越来越接近一个真正意义上的 &lt;strong&gt;“通用视觉编辑平台模型”&lt;/strong&gt; —— 而不仅仅是图像生成器的延伸。&lt;/p&gt;

&lt;h2&gt;
  
  
  参考链接
&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;模型相关&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Qwen-Image-Edit-2511（HuggingFace 模型页）
&lt;a href="https://huggingface.co/Qwen/Qwen-Image-Edit-2511" rel="noopener noreferrer"&gt;https://huggingface.co/Qwen/Qwen-Image-Edit-2511&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;qwen-image-edit-251 comfyui 适配说明：&lt;a href="https://docs.comfy.org/tutorials/image/qwen/qwen-image-edit-2511" rel="noopener noreferrer"&gt;qwen-image-edit-251&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;Qwen-Image-Edit-2511-Lightning（HuggingFace）
&lt;a href="https://huggingface.co/lightx2v/Qwen-Image-Edit-2511-Lightning" rel="noopener noreferrer"&gt;https://huggingface.co/lightx2v/Qwen-Image-Edit-2511-Lightning&lt;/a&gt;
&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;在线体验&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;a href="https://huggingface.co/spaces/Qwen/Qwen-Image-Edit-2511" rel="noopener noreferrer"&gt;huggingface 平台&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="https://modelscope.cn/aigc/imageGeneration?tab=advanced&amp;amp;versionId=507464&amp;amp;modelType=checkpoint&amp;amp;sdVersion=QWEN_IMAGE_EDIT_2511&amp;amp;modelUrl=modelscope%3A%2F%2FQwen%2FQwen-Image-Edit-2511%3Frevision%3Dmaster" rel="noopener noreferrer"&gt;model scope&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="https://chat.qwen.ai/?inputFeature=image_edit" rel="noopener noreferrer"&gt;qwen chat&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="https://t.aliyun.com/U/ufuKiX" rel="noopener noreferrer"&gt;阿里云百炼平台&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="https://z-image.app/models/qwen-image-edit-2511" rel="noopener noreferrer"&gt;qwen-image-edit-2511&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;

</description>
      <category>machinelearning</category>
      <category>ai</category>
      <category>news</category>
      <category>opensource</category>
    </item>
    <item>
      <title>Z-Image vs Nano Banana Pro vs FLUX.2 Pro</title>
      <dc:creator>Yang ella</dc:creator>
      <pubDate>Thu, 04 Dec 2025 07:25:16 +0000</pubDate>
      <link>https://dev.to/yang_ella_f2a3e16ccb54550/z-image-vs-nano-banana-pro-vs-flux2-pro-2e59</link>
      <guid>https://dev.to/yang_ella_f2a3e16ccb54550/z-image-vs-nano-banana-pro-vs-flux2-pro-2e59</guid>
      <description>&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fcdn.z-image.app%2Fz-image-vs%2Fvs-params-en.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fcdn.z-image.app%2Fz-image-vs%2Fvs-params-en.png" alt="vs-params-en" width="800" height="505"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;&lt;strong&gt;Z-IMAGE&lt;/strong&gt;: 6B parameters, sub-second generation, $0.005 per image&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;While Z-Image dominates Nano Banana Pro and FLUX.2 Pro in speed and cost, how much &lt;em&gt;real&lt;/em&gt; quality is lost? We tested 5 real-world scenarios (15 images total) to find out—and the answer may surprise you: for most practical use cases, Z-Image is already sufficient.&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;FLUX.2 Pro&lt;/strong&gt;, powered by 32B parameters, leads the professional scene with unparalleled detail and refinement.
&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Nano Banana Pro&lt;/strong&gt; (Gemini 3 Pro image variant) excels in multimodal editing and photorealism.
&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Z-Image Turbo&lt;/strong&gt;, Alibaba’s open-weight 6B model, claims “1-second generation, $0.005/image,” and even runs smoothly on consumer laptops with 16GB VRAM.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  Core Specifications Comparison
&lt;/h2&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Metric&lt;/th&gt;
&lt;th&gt;Z-Image Turbo&lt;/th&gt;
&lt;th&gt;Nano Banana Pro&lt;/th&gt;
&lt;th&gt;FLUX.2 Pro&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;Parameters&lt;/td&gt;
&lt;td&gt;6B&lt;/td&gt;
&lt;td&gt;Undisclosed&lt;/td&gt;
&lt;td&gt;32B&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Generation Time&lt;/td&gt;
&lt;td&gt;1–2 sec (8 steps)&lt;/td&gt;
&lt;td&gt;5–10 sec&lt;/td&gt;
&lt;td&gt;10–30 sec&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Price (via fal.ai)&lt;/td&gt;
&lt;td&gt;&lt;strong&gt;$0.005&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;$0.15&lt;/td&gt;
&lt;td&gt;$0.03&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;&lt;strong&gt;Bottom line&lt;/strong&gt;: &lt;strong&gt;Z-Image’s cost and speed are 1/10–1/30 of competitors’, while the visual quality gap is &lt;em&gt;far&lt;/em&gt; smaller than that ratio suggests.&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;Let’s dive into 5 real-world comparisons.&lt;/p&gt;




&lt;h2&gt;
  
  
  1. Photorealistic Portrait
&lt;/h2&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Z-Image&lt;/th&gt;
&lt;th&gt;Nano Banana Pro&lt;/th&gt;
&lt;th&gt;FLUX.2 Pro&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fqee9og0gufcmwymmb2zb.webp" alt="z-image-chinese-girl-summer-beach-deck" width="800" height="800"&gt;&lt;/td&gt;
&lt;td&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fbiz40d17cj8dm00v30uw.webp" alt="nano-banana-chinese-girl-summer-beach-deck" width="800" height="800"&gt;&lt;/td&gt;
&lt;td&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F4s8z251dxbn9z67vunrd.webp" alt="flux-2-pro-chinese-girl-summer-beach-deck" width="800" height="800"&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;&lt;strong&gt;Verdict&lt;/strong&gt;:&lt;br&gt;&lt;br&gt;
All three perform well, but Z-Image delivers a more pleasing aesthetic—softer skin tones, natural lighting, and a more relaxed pose. FLUX.2 shows slightly better fabric texture (e.g., shirt folds), but Z-Image feels more “human.”&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Prompt&lt;/strong&gt;&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight markdown"&gt;&lt;code&gt;Cinematic photo, summer vibes. A beautiful Chinese young girl sitting on a wooden beach deck, leaning back comfortably. She has messy blonde hair, sunglasses perched on her head, and soft makeup. She wears a white t-shirt with red graphic text and red retro gym shorts. The fabric of the shirt is light and airy. Beside her is a soft drink cup and colorful beach balls. The background features a blurred sunny beach scene with a distinctive red and white lifeguard station and blue ocean. High contrast lighting, dappled shadows from an umbrella, 8k resolution, photorealistic textures, depth of field.
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;






&lt;h2&gt;
  
  
  2. Magazine Cover
&lt;/h2&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Z-Image&lt;/th&gt;
&lt;th&gt;Nano Banana Pro&lt;/th&gt;
&lt;th&gt;FLUX.2 Pro&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fqd2nan24o23v4ntdw4uf.webp" alt="z-image-magazine-woman-with-wet-slicked-back-hair" width="720" height="1280"&gt;&lt;/td&gt;
&lt;td&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Ft7g0gligp72g2xb37kd7.webp" alt="nano-banana-magazine-woman-with-wet-slicked-back-hair" width="721" height="1075"&gt;&lt;/td&gt;
&lt;td&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fsvyu9rf5gxu6qgxc6wtz.webp" alt="flux-2-pro-magazine-woman-with-wet-slicked-back-hair" width="720" height="1280"&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;&lt;strong&gt;Verdict&lt;/strong&gt;:&lt;br&gt;&lt;br&gt;
Z-Image nails the subject lighting and facial softness—more editorial, less “stiff.” FLUX.2 and Nano Banana render text more accurately (e.g., “NOCTURNE”, volume info), but Z-Image adds &lt;em&gt;extra&lt;/em&gt; decorative glyphs (not in prompt) that look plausible yet fictional—great for mockups, risky for production.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Prompt&lt;/strong&gt;&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight markdown"&gt;&lt;code&gt;A magazine cover of a cool 20-year-old Chinese woman with wet slicked-back hair, standing under a transparent umbrella on a rain-slicked Hong Kong street at night. She wears an oversized black leather trench coat and silver hoop earrings. The background is filled with blurred red and blue neon signs reflecting on the wet asphalt. Cinematic lighting with strong contrast, Wong Kar-wai aesthetic, Kodak Portra 800 style, vibrant colors, moody atmosphere, medium shot. 8K resolution.

Magazine layout:
Title "NOCTURNE".
Cover text: "Neon Soul", "Midnight Express", "Vol. 09 | Winter 2025".
Barcode bottom. Bold sans-serif typography in white and neon red.
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;






&lt;h2&gt;
  
  
  3. Illustration (Anthropomorphic Fox)
&lt;/h2&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Z-Image&lt;/th&gt;
&lt;th&gt;Nano Banana Pro&lt;/th&gt;
&lt;th&gt;FLUX.2 Pro&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fuvyvwiav7ojahd07yuv9.webp" alt="z-image-anthropomorphic-orange-fox-napping-on-beanbag-chair" width="800" height="800"&gt;&lt;/td&gt;
&lt;td&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fd1k6kn9gq8aotg9ktrzj.webp" alt="nano-banana-anthropomorphic-orange-fox-napping-on-beanbag-chair" width="800" height="800"&gt;&lt;/td&gt;
&lt;td&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Frldsh1a98xmobbjpcfbd.webp" alt="flux-2-pro-anthropomorphic-orange-fox-napping-on-beanbag-chair" width="800" height="800"&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;&lt;strong&gt;Verdict&lt;/strong&gt;:&lt;br&gt;&lt;br&gt;
All three are excellent—consistent style, texture, and mood. Z-Image edges ahead with slightly warmer lighting and more cohesive color balance. No significant gaps in quality; ideal for children’s books or branding assets.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Prompt&lt;/strong&gt;&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight markdown"&gt;&lt;code&gt;An illustration of an anthropomorphic orange fox taking a nap on a large, soft green beanbag chair. The fox is wearing round glasses, a casual outfit with sneakers, and has a peaceful expression. Beside the chair on the floor sits a retro brown radio with a glowing dial. The art style is painterly with visible textures, resembling a modern storybook illustration. The lighting is warm and cozy, suggesting a lazy afternoon. Isolated on a plain white background. 1:1 aspect ratio
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;






&lt;h2&gt;
  
  
  4. OOTD (Outfit of the Day) Mood Board
&lt;/h2&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Z-Image&lt;/th&gt;
&lt;th&gt;Nano Banana Pro&lt;/th&gt;
&lt;th&gt;FLUX.2 Pro&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fz78syafov4mch9ojnxl6.webp" alt="sweet-date-ootd-mood-board-pink-labubu" width="720" height="1280"&gt;&lt;/td&gt;
&lt;td&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fe16pvyqjogq8podwv54w.webp" alt="nano-banana-sweet-date-ootd-mood-board-pink-labubu" width="768" height="1376"&gt;&lt;/td&gt;
&lt;td&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fhz1pjspa4znkcgl8tb4u.webp" alt="flux-2-pro-sweet-date-ootd-mood-board-pink-labubu" width="720" height="1280"&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;&lt;strong&gt;Verdict&lt;/strong&gt;:&lt;br&gt;&lt;br&gt;
This is a &lt;em&gt;layout-heavy&lt;/em&gt;, symbolic prompt—not about literal accuracy. All models fail to perfectly map “OOTD elements ↔ main subject’s clothing,” as expected (LLMs aren’t visual parsers). Yet Z-Image delivers the most harmonious &lt;em&gt;visual&lt;/em&gt; composition: better color flow, balanced spacing, and cohesive Labubu integration. However—&lt;strong&gt;critical note&lt;/strong&gt;: Z-Image hallucinates Chinese calligraphy (e.g., random strokes), while Nano Banana and FLUX.2 render correct semantic labels. &lt;em&gt;Z-Image should not be trusted for unguided text generation.&lt;/em&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Prompt&lt;/strong&gt;&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight markdown"&gt;&lt;code&gt;A 9:16 vertical screen high-end fashion illustration mood board, simulating a tablet scan effect. The background is pure hand-drawn creamy watercolor gradient paper with a faint pink grid. The visual core consists of several glossy vinyl stickers with distinct white die-cut wide borders and soft shadows. The central sticker is a photo of the user wearing a sweet date outfit, with bright lighting. On the left side is a deconstructed sticker of this outfit: a neatly folded jacket and exquisite high heels. In the bottom right corner is the key hidden layer sticker: a chic open mini-handbag revealing daily essentials like a tube of lipstick and vintage sunglasses, showcasing leather and glass textures. A Labubu art doll sticker in pink tones that echoes the user's clothing is lying on a hand-drawn speech bubble. The surroundings are decorated with crayon-textured hand-drawn hearts, sparkle symbols, and scribbled Chinese calligraphy annotations for OOTD. The image contains absolutely no human hands, pens, or physical desktop backgrounds—pure flat art illustration.
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;






&lt;h2&gt;
  
  
  5. Creative Advertising (Oreo Concept)
&lt;/h2&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Z-Image&lt;/th&gt;
&lt;th&gt;Nano Banana Pro&lt;/th&gt;
&lt;th&gt;FLUX.2 Pro&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F0sflcnxkmhp60ow04svu.webp" alt="z-image Creative 3D ad for oreo" width="800" height="800"&gt;&lt;/td&gt;
&lt;td&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fk2fqvl4b45d220ssrg54.webp" alt="nano-banana-Creative 3D ad for oreo" width="800" height="800"&gt;&lt;/td&gt;
&lt;td&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fsy9qu3n7b9i38fz3ghxu.webp" alt="flux-2-pro-Creative 3D ad for oreo" width="800" height="800"&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;&lt;strong&gt;Verdict&lt;/strong&gt;:&lt;br&gt;&lt;br&gt;
Here, Z-Image underperforms. The concept is generic (just stacked cookies), and slogan/logo are garbled or missing. Nano Banana shines with a surreal “Oreo galaxy” motif and correct slogan placement. FLUX.2 delivers refined product realism and spatial coherence. &lt;strong&gt;Takeaway&lt;/strong&gt;: For &lt;em&gt;open-ended, conceptual ideation&lt;/em&gt;, larger models with stronger world-modeling (e.g., Nano Banana) still lead. Z-Image thrives only when prompts are &lt;em&gt;concrete and constrained&lt;/em&gt;.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Prompt&lt;/strong&gt;&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight markdown"&gt;&lt;code&gt;Creative 3D ad for oreo, with surreal object made from it, matching background color, real slogan below, logo on top, miniature person interacting, minimal and clever concept
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;






&lt;h2&gt;
  
  
  Final Summary
&lt;/h2&gt;

&lt;p&gt;Z-Image Turbo proves that &lt;strong&gt;smaller models can punch far above their weight&lt;/strong&gt;—especially when optimized for inference efficiency and fine-tuned on high-quality, diverse data.&lt;/p&gt;

&lt;p&gt;✅ &lt;strong&gt;Where Z-Image excels&lt;/strong&gt;:  &lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Photorealistic portraits &amp;amp; lifestyle scenes
&lt;/li&gt;
&lt;li&gt;Stylized illustrations with clear visual references
&lt;/li&gt;
&lt;li&gt;Rapid prototyping &amp;amp; UI/UX asset generation
&lt;/li&gt;
&lt;li&gt;Cost-sensitive high-volume workflows
&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;⚠️ &lt;strong&gt;Where it lags&lt;/strong&gt;:  &lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Free-form conceptual ideation
&lt;/li&gt;
&lt;li&gt;Complex layouts requiring &lt;em&gt;accurate&lt;/em&gt; text rendering
&lt;/li&gt;
&lt;li&gt;Scenes demanding deep semantic reasoning (e.g., symbolic storytelling)
&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;💡 &lt;strong&gt;Recommendation&lt;/strong&gt;:&lt;br&gt;&lt;br&gt;
For 80% of everyday image-generation tasks—social content, e-commerce mockups, editorial visuals—&lt;strong&gt;Z-Image is not just “good enough”: it’s optimal&lt;/strong&gt;. Reserve Nano Banana Pro or FLUX.2 Pro for high-stakes campaigns, ad finals, or when textual precision is non-negotiable.&lt;/p&gt;

&lt;p&gt;In 2025, democratized AI image generation isn’t about chasing parameter counts—it’s about finding the &lt;em&gt;right tool for the job&lt;/em&gt;. And for most jobs? &lt;strong&gt;Z-Image is it.&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;I also built a web interface to evaluate the latest wave of image generation models. It allows you to run prompts across Z-Image Turbo, Nano Banana Pro,  Flux.2 Pro or other top ai models simultaneously to compare inference speed and visual fidelity. Try it at: &lt;a href="https://z-image.app/arena" rel="noopener noreferrer"&gt;https://z-image.app/arena&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fal71bv8sdhnwj3qyj3yv.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fal71bv8sdhnwj3qyj3yv.png" alt=" " width="800" height="440"&gt;&lt;/a&gt;&lt;/p&gt;

</description>
      <category>zimage</category>
      <category>ai</category>
      <category>nanobananapro</category>
      <category>flux2pro</category>
    </item>
    <item>
      <title>揭秘 Nano Banana新玩法：Google 的 AI 图像编辑新王炸</title>
      <dc:creator>Yang ella</dc:creator>
      <pubDate>Sat, 30 Aug 2025 00:20:59 +0000</pubDate>
      <link>https://dev.to/yang_ella_f2a3e16ccb54550/jie-mi-nano-bananaxin-wan-fa-google-de-ai-tu-xiang-bian-ji-xin-wang-zha-42ml</link>
      <guid>https://dev.to/yang_ella_f2a3e16ccb54550/jie-mi-nano-bananaxin-wan-fa-google-de-ai-tu-xiang-bian-ji-xin-wang-zha-42ml</guid>
      <description>&lt;p&gt;你可能已经听说过“Nano Banana”这个神秘又有趣的代号——它不是水果，也不是玩具，而是 &lt;strong&gt;Google 最新推出的 AI 图像生成与编辑模型 Gemini 2.5 Flash Image&lt;/strong&gt; 。&lt;/p&gt;

&lt;p&gt;这个模型在 LMArena 基准测试中位列榜首，凭借&lt;strong&gt;角色一致性保持、自然语言精准修图、多图融合&lt;/strong&gt;等能力，被誉为“Vibe Photoshoping”的开创者 。它不仅能生成高质量图像，还能理解图像与文字的双重输入，实现真正的&lt;strong&gt;对话式图像编辑&lt;/strong&gt; 。&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;🔍 &lt;strong&gt;小知识&lt;/strong&gt;：Nano Banana 是开发代号，其官方名称为 &lt;strong&gt;Gemini 2.5 Flash Image Preview&lt;/strong&gt;，是 Gemini 2.0 Flash 的升级版 。由于原名太长，社区更爱叫它“Nano Banana” 。&lt;/p&gt;
&lt;/blockquote&gt;

&lt;h2&gt;
  
  
  核心能力一览
&lt;/h2&gt;

&lt;p&gt;Gemini 2.5 Flash Image 支持多种高级图像操作，包括：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;✅ 文本生成图像（Text-to-Image）&lt;/li&gt;
&lt;li&gt;✅ 图像修复（Inpainting）：移除或添加对象&lt;/li&gt;
&lt;li&gt;✅ 背景替换（Background Replacement）&lt;/li&gt;
&lt;li&gt;✅ 图像扩展（Outpainting）&lt;/li&gt;
&lt;li&gt;✅ 多轮自然语言图像编辑 &lt;/li&gt;
&lt;li&gt;✅ 多图融合与组合生成 &lt;/li&gt;
&lt;li&gt;✅ 高精度局部文字编辑（无需手动选区）&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;所有生成图像均包含&lt;strong&gt;隐形 SynthID 数字水印&lt;/strong&gt;，用于标识AI生成内容 。&lt;/p&gt;

&lt;h2&gt;
  
  
  本文实战案例速览
&lt;/h2&gt;

&lt;p&gt;以下是你将在这篇文章中看到的 &lt;strong&gt;9 大真实应用场景&lt;/strong&gt;，每一项都基于 Gemini 2.5 Flash Image 的原生多模态能力实现：&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;🌌 超写实图像生成&lt;/strong&gt;
——木星轨道上的废弃空间站，细节震撼&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;🛍️ 电商商品合成&lt;/strong&gt;
——真人手持手包、沙发换色换场景，零设计门槛&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;✏️ 文字智能编辑&lt;/strong&gt;
——一键移除或替换图片中的文字，无需选区&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;🌅 背景自由替换&lt;/strong&gt;
——从阴雨天到绝美日落，氛围随心切换&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;🖼️ 分镜图生成&lt;/strong&gt;
——6格角色情绪图，打造动画级视觉叙事&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;🎎 手办建模渲染&lt;/strong&gt;
——Figma风格手办 + 博物馆展柜，IP衍生新玩法&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;📊 信息图自动生成&lt;/strong&gt;
——肌肉骨骼解剖图、手机进化史，知识可视化利器&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;👗 穿搭平铺图（OOTD）&lt;/strong&gt;
——自动提取服装单品，生成电商级 flat lay&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;🃏 创意卡片设计&lt;/strong&gt;
——宝可梦卡、Q版角色卡，一键生成收藏级卡片&lt;/li&gt;
&lt;/ol&gt;




&lt;blockquote&gt;
&lt;p&gt;没有繁琐操作，没有专业软件，只有&lt;strong&gt;一句话 + 一张图 = 你想要的世界&lt;/strong&gt;。&lt;br&gt;&lt;br&gt;
接下来，我们将逐一拆解这些案例背后的 &lt;strong&gt;Prompt 技巧与底层逻辑&lt;/strong&gt;，带你掌握 Google 这位“AI 视觉大脑”的真正用法。&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;（继续阅读，获取完整 Prompt 模板与实战技巧 →）&lt;/p&gt;

&lt;h2&gt;
  
  
  图片生成
&lt;/h2&gt;

&lt;p&gt;超写实废弃太空站&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;Generate a photorealistic image of an abandoned space station orbiting Jupiter during a solar eclipse, with floating debris and emergency lights, but without any human figures or Earth visible. The image should have an eerie, isolated quality, emphasizing the scale of Jupiter and the play of light on metallic surfaces.&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fpihii2kbmhzstgxl1yd8.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fpihii2kbmhzstgxl1yd8.webp" alt="abandoned space station orbiting Jupiter" width="800" height="800"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;A photorealistic ESC keycap scene shows a miniature cozy living room setup. Inside: a glowing red Netflix screen, a plush red couch, popcorn bowl, and throw blanket. A small figure lounges with feet up, watching content. The red “N” logo glows from behind like mood lighting. Outside: cool tech-blue reflections on F1, Shift, and Q keys. The word “ESC” is subtly present in a glassy fog on top of the cap.&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fx8i6sq5ehoazlqe1jqt6.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fx8i6sq5ehoazlqe1jqt6.webp" alt="esc-key-cap-scene" width="512" height="512"&gt;&lt;/a&gt;&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight markdown"&gt;&lt;code&gt;特写镜头：一只手正拿着一张设计成 VS Code 中 JSON 文件外观的名片。名片上的代码以真实的 JSON 语法高亮格式呈现。窗口界面包含典型的工具栏图标和标题栏，标题显示为 Business Card.json，整体风格与 VS Code 界面完全一致。背景略微虚化，突出展示名片内容。
名片上的 JSON 代码如下所示：
{
"name": "Jamez Bondos",
"title": "Your Title",
"email": "your@email.com",
"link": "yourwebsite"
}
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fnk56b3qddbp1vkdhjesk.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fnk56b3qddbp1vkdhjesk.webp" alt="vscode-card" width="800" height="800"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  电商宣传图 / Product Mockup
&lt;/h2&gt;

&lt;p&gt;一键生成商品图，支持颜色更改、场景替换、背景融合，适用于电商快速出图 &lt;/p&gt;

&lt;p&gt;人物和产品都还原的没有一点瑕疵&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;let the girl hold this handbag&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fit985i9ucddb76edtn4v.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fit985i9ucddb76edtn4v.webp" alt="girl-hand-bag-product-mockup" width="800" height="523"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;Change the sofa in the living room to a green velvet couch and add a modern art piece on the wall&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fpeat35ub9nqrnvjedgcb.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fpeat35ub9nqrnvjedgcb.webp" alt="sofa-mockup" width="800" height="387"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  文字编辑 / Text Edit
&lt;/h2&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;原图&lt;/th&gt;
&lt;th&gt;移除文字&lt;/th&gt;
&lt;th&gt;替换文字&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fg1xqcyg3lpt36iz60hnj.webp" alt="hepingxiang-giel" width="800" height="1201"&gt;&lt;/td&gt;
&lt;td&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fjplaln7dpllgppo7sblf.webp" alt="hepingxiang-girl-no-text" width="683" height="1024"&gt;&lt;/td&gt;
&lt;td&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fjzvpzjrwagm40qd8204z.webp" alt="hepingxiang-girl-replace-text" width="800" height="1200"&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;h2&gt;
  
  
  更换背景 / Change background
&lt;/h2&gt;

&lt;p&gt;通过自然语言指令，轻松实现背景替换，从雨天变夕阳，一键切换氛围&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;悲伤下雨天&lt;/th&gt;
&lt;th&gt;绝美艳阳天&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;change the background to a sad rainy day&lt;/td&gt;
&lt;td&gt;Change the background to a stunning sunset&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F2a7incptr34khfyxyc09.webp" alt="hepingxiang-girl-rainy-day" width="800" height="1200"&gt;&lt;/td&gt;
&lt;td&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fkp10483mtgmaaq8lnfnx.webp" alt="hepingxiang-girl-sunset-day" width="800" height="1200"&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;h2&gt;
  
  
  子图 / 分镜图
&lt;/h2&gt;

&lt;p&gt;这个有些槽点，图片没有按照3x2排列。&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;Refer to the girl in this picture and create  a landscape-oriented image with 6 sub  images   arranged in a 3×2 grid  , all the images show the same character in different settings and with different expressions (e.g., happy, surprised, determined). The art style should be consistent across all depictions, and the overall composition should be balanced and visually appealing.&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Focyt1s5kmzws026mnxqf.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Focyt1s5kmzws026mnxqf.webp" alt="hepingxiang-girl-sub-emotion.webp" width="800" height="1200"&gt;&lt;/a&gt; &lt;/p&gt;

&lt;p&gt;生成分镜图并不稳定，有时候是生成一张图，有时候是多张图。 图片多了之后，人物的连续性就会变差。&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;Refer to this picture and create 4 image, all the images show the same character in different settings and with different expressions (e.g., happy, surprised, determined). The art style should be consistent across all depictions, and the overall composition should be balanced and visually appealing.&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fb0lvdsxlzg17trmxotw2.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fb0lvdsxlzg17trmxotw2.webp" alt="dynamic-pose-for-the-animated-girl" width="800" height="800"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  手办 / Action figure
&lt;/h2&gt;

&lt;p&gt;将人物转化为Figma风格手办或博物馆展柜风格模型，适合IP衍生设计&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;turn this photo into a character figure. Behind it, place a box with the character’s image printed on it, and a computer showing the Blender modeling process on its screen. In front of the box, add a round plastic base with the character figure standing on it. set the scene indoors if possible&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fcy5cwpv7kpdtvq6hxwpf.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fcy5cwpv7kpdtvq6hxwpf.webp" alt="animation-character-figure" width="800" height="800"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;figma 风格&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;turn this character into a highly detailed and articulated anime action figure, in the style of a Figma. The figure should have visible joints at the elbows, knees, and shoulders, and be posed in a dynamic action stance. Place it on a hexagonal, articulated stand with a clear posing arm. Behind it, create a sleek, modern box featuring photos of the figure in various action poses.&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fzzaea8cuwqnghs5pu8wa.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fzzaea8cuwqnghs5pu8wa.webp" alt="action-figure-figma" width="512" height="512"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;橱柜风格 &lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;turn this character in this photo into A pristine, masterfully crafted anime scale figure  showcased as the centerpiece inside a modern, museum-style glass display cabinet. The cabinet is illuminated by clean, perfectly angled LED spotlights from above, highlighting the intricate paint job and sculpting details. Other premium figures are visible but out of focus on shelves in the background, creating a sense of a prized collection. The shot is clean and minimalist, emphasizing the figure as a work of art.&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F00b7a0fzkkjta5dp2u0u.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F00b7a0fzkkjta5dp2u0u.webp" alt="action-figure- in cabinet" width="800" height="800"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  信息图 / Infographics
&lt;/h2&gt;

&lt;p&gt;肌肉解剖信息图 /muscle and skeleton infographic&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;Create a clear, educational infographic comparing the human skeletal and muscular systems in a side-by-side anatomical layout. Use a clean, scientific style with a white or light background for readability. On the left, show a detailed anterior (front) view of the skeleton with labeled major bones (skull, spine, ribcage, femur, etc.) in a neutral gray tone. On the right, display the major muscle groups (pectorals, biceps, quadriceps, etc.) in color-coded red (flexors) and blue (extensors). Include a small central inset showing how muscles attach to bones via tendons, with a magnified cross-section of a joint (e.g., elbow or knee). Add brief annotations, a color legend, and a title: 'Human Skeletal &amp;amp; Muscular Systems – Structure and Function'. Use sans-serif typography, subtle grid lines, and a modern medical illustration style. Ensure the layout is balanced, informative, and suitable for students or healthcare education.&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fxb1y9y7cifdtzmnvqtql.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fxb1y9y7cifdtzmnvqtql.webp" alt="muscle-and-skeleton-infographic.webp" width="512" height="512"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;手机进化史&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;Content: Create a timeline infographic showing the evolution of the smartphone from the first IBM Simon Personal Communicator in 1994 to the latest models.&lt;br&gt;
Visual Style: A clean, chronological timeline with illustrations of each key device. Use a modern, tech-oriented color palette (blues, greys, and a bright accent color).&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F7vxby0e1bh5yrc3jiw17.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F7vxby0e1bh5yrc3jiw17.webp" alt="infographics-smart-phone-evolution.webp" width="800" height="800"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  穿搭 / OOTD平铺图
&lt;/h2&gt;

&lt;blockquote&gt;
&lt;p&gt;Create a clean, well-organized flat lay photography composition featuring all the clothing items from the reference image, arranged neatly on a plain white or light-gray seamless background. Include every garment (e.g., top, pants, dress, jacket, skirt) and visible accessories (shoes, bag, hat, jewelry) laid flat and fully visible. Use soft, even lighting with subtle shadows to maintain a realistic yet minimalist aesthetic. Ensure accurate colors, textures, and proportions. Style: modern, editorial fashion look — ideal for e-commerce, lookbooks, or wardrobe planning. Do not include people, mannequins, or cluttered backgrounds.&lt;/p&gt;
&lt;/blockquote&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;&lt;/th&gt;
&lt;th&gt;&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F4u3h02mz5rt7j9z5t7bb.webp" alt="girl-with-white-weather" width="648" height="863"&gt;&lt;/td&gt;
&lt;td&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fq1d08jipmbfc762hocl2.webp" alt="flat-lay-outfits-white-weather" width="800" height="1096"&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;&lt;/th&gt;
&lt;th&gt;&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Finlz0h2qfqm5ik283o0s.webp" alt="gitl-skirt" width="682" height="910"&gt;&lt;/td&gt;
&lt;td&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fcsc8f930a3a02jb9mf2x.webp" alt="flat-lay-outfits-blue-skirt" width="747" height="1024"&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fxlvi1aua72gkmsr45403.webp" alt="gitl-orange-shirt" width="800" height="1372"&gt;&lt;/td&gt;
&lt;td&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fknzglipc9bh2u3nhqr3i.webp" alt="flat-lay-outfits-orange-shirt" width="768" height="1344"&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;h2&gt;
  
  
  卡片 / Cards
&lt;/h2&gt;

&lt;p&gt;支持生成宝可梦卡、Q版角色卡等创意卡片，适用于IP设计与内容营销。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Pokemon Cards&lt;/strong&gt;&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight markdown"&gt;&lt;code&gt;
A custom Pokémon card featuring a 3D chibi character inspired by the uploaded image. The card design should be in the classic Pokémon TCG style, with all thematic elements generated based on the character's appearance.

&lt;span class="gs"&gt;**Image Composition:**&lt;/span&gt;
The entire Pokémon card is displayed against a &lt;span class="gs"&gt;**clean, minimalist, pure white background.**&lt;/span&gt; The card itself should cast a &lt;span class="gs"&gt;**soft, subtle drop shadow**&lt;/span&gt; beneath it, giving it a sense of depth as if it is floating slightly above the surface.

&lt;span class="gs"&gt;**Card Layout:**&lt;/span&gt;
Analyze the character in the image to determine the most fitting Pokémon type (e.g., Fire, Water, Grass, Psychic, Electric, etc.). The card's border color and all energy symbols used must correspond to this chosen type. At the top, include the character's name "Kella" in a bold font, and generate a plausible HP value (e.g., HP 90, HP 120). The aspect ratio should be 2.5:3.5 (standard card size).

&lt;span class="gs"&gt;**Character Illustration:**&lt;/span&gt;
The central artwork should be a high-quality 3D render of the chibi character. The style should be playful and dynamic, similar to modern Pokémon illustrations. The character should have a polished, smooth texture, set against a holographic background with abstract energy swirls that match the card's chosen type.

&lt;span class="gs"&gt;**Attacks Section:**&lt;/span&gt;
Based on the character's design and chosen type, generate two unique and thematically appropriate attacks. For each attack, create a creative name, a logical energy cost (using the corresponding type symbol and colorless symbols), and a balanced damage number.

&lt;span class="gs"&gt;**Bottom Info Bar:**&lt;/span&gt;
Generate a logical Weakness, Resistance, and Retreat Cost that would be appropriate for the character's determined Pokémon type. Use the standard, official symbols from the Pokémon TCG for this section.

&lt;span class="gs"&gt;**Overall Feel:**&lt;/span&gt;
Authentic, official Pokémon TCG card design, high detail, vibrant colors, clean and sharp text.

--no blurry text, incorrect symbols, misaligned elements, watermark, signature, poorly drawn, bad anatomy
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fq02hi52eqms14pt7p102.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fq02hi52eqms14pt7p102.webp" alt="pokemon-cards-animal-girl" width="800" height="800"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;使用真人照片&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F9p1uk110emycy7mflku5.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F9p1uk110emycy7mflku5.webp" alt="pokemon-cards-cool-siting-girl" width="800" height="1096"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Futgbv3sr1kwvpv42p000.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Futgbv3sr1kwvpv42p000.webp" alt="pokemon-cards-cool-one-knee-girl" width="800" height="1096"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Q版卡片：&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fmk9f04545d4p8ewkfmx6.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fmk9f04545d4p8ewkfmx6.webp" alt="q-card-yellow" width="293" height="512"&gt;&lt;/a&gt; &lt;br&gt;
&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F0gb1nuvh30eprxuapnar.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F0gb1nuvh30eprxuapnar.webp" alt="q-card-orange" width="398" height="512"&gt;&lt;/a&gt;&lt;br&gt;&lt;br&gt;
&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fan0icx3q8u5dqg7nwyuc.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fan0icx3q8u5dqg7nwyuc.webp" alt="q-card-red" width="800" height="800"&gt;&lt;/a&gt;  &lt;/p&gt;

&lt;h2&gt;
  
  
  结语
&lt;/h2&gt;

&lt;p&gt;“Nano Banana”不是玩笑，而是 Google 在 AI 图像领域的一次重大突破。作为 Gemini 2.5 Flash Image，它代表了当前最快、最高效、最具创意控制力的原生多模态图像模型之一 ，生成速度通常在10秒内 &lt;/p&gt;

&lt;p&gt;无论是设计师、电商运营，还是内容创作者，掌握这一工具，都将极大提升你的AI生产力。&lt;/p&gt;

&lt;p&gt;原文链接：&lt;a href="https://yeekal.com/ai/nano-banana-prompt-guidebook/" rel="noopener noreferrer"&gt;https://yeekal.com/ai/nano-banana-prompt-guidebook/&lt;/a&gt;&lt;br&gt;
nano banana 试用链接：&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;a href="https://gemini.google.com/app" rel="noopener noreferrer"&gt;https://gemini.google.com/app&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="https://aistudio.google.com/" rel="noopener noreferrer"&gt;https://aistudio.google.com/&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="https://kontextflux.io/image-models/gemini-25-flash-image" rel="noopener noreferrer"&gt;https://kontextflux.io/image-models/gemini-25-flash-image&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;

</description>
    </item>
    <item>
      <title>Qwen-Image by Tongyi Achieves New SOTA in Image Generation, Disrupting the Open-Source Landscape</title>
      <dc:creator>Yang ella</dc:creator>
      <pubDate>Wed, 06 Aug 2025 14:40:51 +0000</pubDate>
      <link>https://dev.to/yang_ella_f2a3e16ccb54550/qwen-image-by-tongyi-achieves-new-sota-in-image-generation-disrupting-the-open-source-landscape-2oo0</link>
      <guid>https://dev.to/yang_ella_f2a3e16ccb54550/qwen-image-by-tongyi-achieves-new-sota-in-image-generation-disrupting-the-open-source-landscape-2oo0</guid>
      <description>&lt;p&gt;The Tongyi team has open-sourced its first image model, &lt;strong&gt;Qwen-Image&lt;/strong&gt;, a 20B MMDiT model that is said to rival gpt-4o's complex text rendering and image editing capabilities. The open-sourcing follows the Apache 2.0 license, making it free for commercial use. (Image editing mode is not yet available)&lt;/p&gt;

&lt;p&gt;Key highlights include:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Exceptional Text Generation and Typography:&lt;/strong&gt; Qwen-Image excels at complex text rendering, supporting multi-line layouts, paragraph-level text generation, and refined character details. It achieves highly realistic visual output for both English and Chinese text.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Precise and Consistent Image Editing:&lt;/strong&gt; Thanks to a reinforced multi-task joint training strategy, Qwen-Image demonstrates excellent contextual consistency during image editing, ensuring modified content blends naturally into the original scene.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Leading Performance on Cross-Benchmarks:&lt;/strong&gt; In multiple public authoritative benchmark tests, Qwen-Image has achieved state-of-the-art (SOTA) performance in both image generation and editing tasks, showcasing its power as an advanced foundational model for image generation.&lt;/li&gt;
&lt;/ul&gt;

&lt;blockquote&gt;
&lt;p&gt;Qwen-Image Free Online Experience: &lt;a href="https://kontextflux.io/image-models/qwen-image" rel="noopener noreferrer"&gt;https://kontextflux.io/image-models/qwen-image&lt;/a&gt;&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;&lt;a href="https://camo.githubusercontent.com/3e6ca9cb8a8b9c8f9cf050b36f1918fe2d445ba5c304dcac2f284f897e65dc85/68747470733a2f2f7169616e77656e2d7265732e6f73732d636e2d6265696a696e672e616c6979756e63732e636f6d2f5177656e2d496d6167652f73312e6a70672363656e746572" class="article-body-image-wrapper"&gt;&lt;img src="https://camo.githubusercontent.com/3e6ca9cb8a8b9c8f9cf050b36f1918fe2d445ba5c304dcac2f284f897e65dc85/68747470733a2f2f7169616e77656e2d7265732e6f73732d636e2d6265696a696e672e616c6979756e63732e636f6d2f5177656e2d496d6167652f73312e6a70672363656e746572" width="3787" height="5303"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Qwen-Image has been comprehensively evaluated in numerous public benchmarks, consistently demonstrating superior performance and outperforming existing models across various tasks. For general image generation, the model was rigorously tested on GenEval, DPG, and OneIG-Bench. For image editing, its capabilities were assessed using benchmarks like GEdit, ImgEdit, and GSO. Notably, Qwen-Image's performance in text rendering on LongText-Bench, ChineseWord, and TextCraft is particularly outstanding, especially in Chinese text generation tasks. This consistent leading performance across diverse benchmarks establishes Qwen-Image as a top-tier image generation model, equipped with both broad general capabilities and exceptional precision in text rendering.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fbhwplryc6zb2lgoysw36.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fbhwplryc6zb2lgoysw36.webp" alt="qwen image bench" width="800" height="460"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;In addition to the official benchmark comparisons, the third-party &lt;a href="(https://artificialanalysis.ai/text-to-image/arena?tab=leaderboard-text)"&gt;&lt;strong&gt;Artificial Analysis Image Arena Leaderboard&lt;/strong&gt;&lt;/a&gt; also provides a performance ranking for Qwen-Image.&lt;/p&gt;

&lt;p&gt;Among all image generation models (including both open-source and closed-source), Qwen-Image's performance is roughly on par with Flux Kontext pro, Imagen3.0, and Ideogram 3.0.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fjzha6uicdscy0o5g8u84.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fjzha6uicdscy0o5g8u84.webp" alt="qwen image bench" width="800" height="502"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;When compared exclusively to other open-source models, Qwen-Image indeed achieves SOTA performance.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fl0hdhavgxr1orlc2oh8j.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fl0hdhavgxr1orlc2oh8j.webp" alt="qwen-image-arena-opensource" width="800" height="445"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  Open-Source Model Usage
&lt;/h2&gt;

&lt;p&gt;Qwen-Image model weights are open-sourced on &lt;a href="https://github.com/QwenLM/Qwen-Image" rel="noopener noreferrer"&gt;GitHub&lt;/a&gt;, &lt;a href="https://huggingface.co/Qwen/Qwen-Image" rel="noopener noreferrer"&gt;Hugging Face&lt;/a&gt;, and &lt;a href="https://modelscope.cn/models/Qwen/Qwen-Image" rel="noopener noreferrer"&gt;Modelscope&lt;/a&gt;.&lt;/p&gt;

&lt;p&gt;ComfyUI has already added support for Qwen-Image:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Workflow: &lt;a href="https://raw.githubusercontent.com/Comfy-Org/workflow_templates/refs/heads/main/templates/image_qwen_image.json" rel="noopener noreferrer"&gt;JSON workflow&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;Docs: &lt;a href="https://docs.comfy.org/tutorials/image/qwen/qwen-image" rel="noopener noreferrer"&gt;ComfyUI Native Workflow Example&lt;/a&gt;
&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fq3958ol7fs2qio7zfb07.jpg" alt="ComfyUI Native Workflow for qwen-image" width="800" height="410"&gt;
&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Local Deployment
&lt;/h3&gt;

&lt;ol&gt;
&lt;li&gt;transformers&amp;gt;=4.51.3 (Supporting Qwen2.5-VL)&lt;/li&gt;
&lt;li&gt;Install the latest version of diffusers&lt;/li&gt;
&lt;li&gt;System requirements: 24GB GPU memory and 64GB+ RAM
&amp;gt; pip install git+&lt;a href="https://github.com/huggingface/diffusers" rel="noopener noreferrer"&gt;https://github.com/huggingface/diffusers&lt;/a&gt;
&lt;/li&gt;
&lt;/ol&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight python"&gt;&lt;code&gt;&lt;span class="kn"&gt;from&lt;/span&gt; &lt;span class="n"&gt;diffusers&lt;/span&gt; &lt;span class="kn"&gt;import&lt;/span&gt; &lt;span class="n"&gt;DiffusionPipeline&lt;/span&gt;
&lt;span class="kn"&gt;import&lt;/span&gt; &lt;span class="n"&gt;torch&lt;/span&gt;

&lt;span class="n"&gt;model_name&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;Qwen/Qwen-Image&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;

&lt;span class="c1"&gt;# Load the pipeline
&lt;/span&gt;&lt;span class="k"&gt;if&lt;/span&gt; &lt;span class="n"&gt;torch&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;cuda&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;is_available&lt;/span&gt;&lt;span class="p"&gt;():&lt;/span&gt;
    &lt;span class="n"&gt;torch_dtype&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;torch&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;bfloat16&lt;/span&gt;
    &lt;span class="n"&gt;device&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;cuda&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;
&lt;span class="k"&gt;else&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;
    &lt;span class="n"&gt;torch_dtype&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;torch&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;float32&lt;/span&gt;
    &lt;span class="n"&gt;device&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;cpu&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;

&lt;span class="n"&gt;pipe&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;DiffusionPipeline&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;from_pretrained&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;model_name&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;torch_dtype&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="n"&gt;torch_dtype&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;span class="n"&gt;pipe&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;pipe&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;to&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;device&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="n"&gt;positive_magic&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
    &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;en&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;Ultra HD, 4K, cinematic composition.&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="c1"&gt;# for english prompt
&lt;/span&gt;    &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;zh&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;超清，4K，电影级构图&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt; &lt;span class="c1"&gt;# for chinese prompt
&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;

&lt;span class="c1"&gt;# Generate image
&lt;/span&gt;&lt;span class="n"&gt;prompt&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="sh"&gt;'''&lt;/span&gt;&lt;span class="s"&gt;A coffee shop entrance features a chalkboard sign reading &lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;Qwen Coffee 😊 $2 per cup,&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt; with a neon light beside it displaying &lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;通义千问&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;. Next to it hangs a poster showing a beautiful Chinese woman, and beneath the poster is written &lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;π≈3.1415926-53589793-23846264-33832795-02384197&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;.&lt;/span&gt;&lt;span class="sh"&gt;'''&lt;/span&gt;

&lt;span class="n"&gt;negative_prompt&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt; &lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt; &lt;span class="c1"&gt;# Recommended if you don't use a negative prompt.
&lt;/span&gt;
&lt;span class="c1"&gt;# Generate with different aspect ratios
&lt;/span&gt;&lt;span class="n"&gt;aspect_ratios&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
    &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;1:1&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="mi"&gt;1328&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="mi"&gt;1328&lt;/span&gt;&lt;span class="p"&gt;),&lt;/span&gt;
    &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;16:9&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="mi"&gt;1664&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="mi"&gt;928&lt;/span&gt;&lt;span class="p"&gt;),&lt;/span&gt;
    &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;9:16&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="mi"&gt;928&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="mi"&gt;1664&lt;/span&gt;&lt;span class="p"&gt;),&lt;/span&gt;
    &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;4:3&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="mi"&gt;1472&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="mi"&gt;1104&lt;/span&gt;&lt;span class="p"&gt;),&lt;/span&gt;
    &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;3:4&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="mi"&gt;1104&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="mi"&gt;1472&lt;/span&gt;&lt;span class="p"&gt;),&lt;/span&gt;
    &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;3:2&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="mi"&gt;1584&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="mi"&gt;1056&lt;/span&gt;&lt;span class="p"&gt;),&lt;/span&gt;
    &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;2:3&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="mi"&gt;1056&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="mi"&gt;1584&lt;/span&gt;&lt;span class="p"&gt;),&lt;/span&gt;
&lt;span class="p"&gt;}&lt;/span&gt;

&lt;span class="n"&gt;width&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;height&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;aspect_ratios&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;16:9&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;]&lt;/span&gt;

&lt;span class="n"&gt;image&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="nf"&gt;pipe&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="n"&gt;prompt&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="n"&gt;prompt&lt;/span&gt; &lt;span class="o"&gt;+&lt;/span&gt; &lt;span class="n"&gt;positive_magic&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;en&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt;
    &lt;span class="n"&gt;negative_prompt&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="n"&gt;negative_prompt&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;width&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="n"&gt;width&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;height&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="n"&gt;height&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;num_inference_steps&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="mi"&gt;50&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;true_cfg_scale&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="mf"&gt;4.0&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;generator&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="n"&gt;torch&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nc"&gt;Generator&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;device&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;cuda&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;).&lt;/span&gt;&lt;span class="nf"&gt;manual_seed&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="mi"&gt;42&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;span class="p"&gt;).&lt;/span&gt;&lt;span class="n"&gt;images&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="mi"&gt;0&lt;/span&gt;&lt;span class="p"&gt;]&lt;/span&gt;

&lt;span class="n"&gt;image&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;save&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;example.png&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;

&lt;p&gt;&lt;br&gt;
`&lt;/p&gt;

&lt;h2&gt;
  
  
  Showcase
&lt;/h2&gt;

&lt;p&gt;Let it create an image to summarize Qwen-Image's capabilities for a website:&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fwlvoyzqah8btcjfp5skd.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fwlvoyzqah8btcjfp5skd.webp" alt="movie poster for qwen-image" width="800" height="446"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;A movie poster titled "The Power of Qwen-Image". The first row is the main title in a bold, modern font: "QWEN-IMAGE: THE FUTURE OF IMAGING". The second row, directly below, reads "Witness Unparalleled Text Rendering and Precise Image Editing". The third row states "Starring: Superior Chinese &amp;amp; English Text Generation". The fourth row reads "Director: The 20B MMDiT Architecture". The central visual features a sleek, futuristic computer (representing the 20B MMDiT model) from which radiant colors, whimsical creatures, and dynamic, swirling patterns explosively emerge, symbolizing its generative power. Emerging from the digital energy are clear, realistic depictions of its capabilities: a shop sign with the Chinese text "云存储", a book cover with the English text "The Silent Patient", and a traditional Chinese couplet with elegant calligraphy. The background transitions from dark, cosmic tones into a luminous, dreamlike expanse, evoking a digital fantasy realm. At the bottom edge, the text "Powered by State-of-the-Art Cross-Benchmark Performance" appears in a bold, modern sans-serif font with a glowing, slightly transparent effect. The overall style blends sci-fi surrealism with graphic design flair—sharp contrasts, vivid color grading, and layered visual depth—reminiscent of visionary concept art and digital matte painting. 32K resolution, ultra-detailed, masterpiece.&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;However, I found that when using the same prompt with an aspect ratio that deviates too much from a standard square, the text can become less clear and appear "stuck together." For example, changing the aspect ratio to 3:1 with the same prompt results in this (the second line "Witness" and fourth line "architecture"):&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fkhn7o72qtw5nrb4ldx6v.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fkhn7o72qtw5nrb4ldx6v.webp" alt="movie poster for qwen-image" width="800" height="266"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Of course, many other cases are still excellent:&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fihd1g36c2fkd58p4kaba.jpg" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fihd1g36c2fkd58p4kaba.jpg" alt="code-is-poetry-street-art" width="736" height="736"&gt;&lt;/a&gt;&lt;br&gt;
&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F4ef5n64me23244iw4xqg.jpg" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F4ef5n64me23244iw4xqg.jpg" alt="a-macro-photo-of-an-ant" width="736" height="736"&gt;&lt;/a&gt;&lt;br&gt;
&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fyqdieykze9rhzg6aoz0r.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fyqdieykze9rhzg6aoz0r.webp" alt="raccoon" width="800" height="800"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;A miniature raccoon explorer made of wool wearing all kinds of equipment, walking through dry grass, the whole world is made of felt textile&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;Some official examples:&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fjitkrulr62gvo75m26ry.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fjitkrulr62gvo75m26ry.webp" width="800" height="446"&gt;&lt;/a&gt;&lt;br&gt;
&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fc9v9c60dyha1nxsujrzf.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fc9v9c60dyha1nxsujrzf.webp" width="800" height="800"&gt;&lt;/a&gt;&lt;br&gt;
&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fh6y9rctolfff47vx0uul.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fh6y9rctolfff47vx0uul.webp" width="800" height="446"&gt;&lt;/a&gt;&lt;br&gt;
&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F35xs7qu4hgo3m51uqqdx.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F35xs7qu4hgo3m51uqqdx.webp" width="800" height="800"&gt;&lt;/a&gt;&lt;br&gt;
&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fepycexpzxmaj83jfq7yq.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fepycexpzxmaj83jfq7yq.webp" width="800" height="446"&gt;&lt;/a&gt;&lt;br&gt;
&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fv4yvxxa27925lneq377c.webp" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fv4yvxxa27925lneq377c.webp" width="800" height="446"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;According to tests by users on X (formerly Twitter), other languages like Japanese also work:&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fr7pemaayhqs5c99ud8y8.jpg" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fr7pemaayhqs5c99ud8y8.jpg" width="735" height="410"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  Practical Applications and Future Outlook
&lt;/h2&gt;

&lt;p&gt;Qwen-Image's outstanding capabilities, especially its breakthrough in complex text rendering, make it more than just an image generation tool. It's a creative platform with broad applications across multiple industries.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Applications in Design and Content Creation&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Advertising and Marketing:&lt;/strong&gt; For graphic designers, generating an image with a specific slogan, brand name, and clear product information has always been a challenge. Qwen-Image handles multi-line, varied fonts, and mixed Chinese/English text with ease, significantly shortening the production cycle for ad posters and product images.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Game Development:&lt;/strong&gt; In games, UI elements, street signs, posters, or specific props often need to include text. With Qwen-Image, developers can quickly generate textures with precise text, eliminating the need for complex post-processing.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Education and Publishing:&lt;/strong&gt; Teachers and publishers can use Qwen-Image to create educational illustrations or posters with clear charts, titles, and body text. For example, generating an infographic explaining "deep learning" where all the text is accurately rendered.&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;The Immense Potential of Image Editing&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;Although Qwen-Image's image editing mode is not yet available, its underlying architecture has already demonstrated a powerful ability to understand context. Once this feature is released, its potential will be immense:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Precise Replacement and Modification:&lt;/strong&gt; Imagine being able to select text in an image and replace it with any new content, with the font, lighting, and style blending seamlessly with the original image. This will fundamentally change the image editing workflow.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Content Personalization:&lt;/strong&gt; In e-commerce, you could quickly generate personalized product images with different customer names. On social media, you could easily modify the slogan or text in an image to suit different communication needs.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Seamless Integration:&lt;/strong&gt; Whether it's adding new objects to an existing scene or applying stylistic adjustments, the powerful multi-task joint training will ensure that the edited image maintains a high degree of consistency and naturalness with the original.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  AI Arena
&lt;/h2&gt;

&lt;p&gt;Beyond the open-source model, to comprehensively evaluate Qwen-Image's general image generation capabilities and objectively compare it with advanced closed-source models, the team has launched &lt;a href="https://aiarena.alibaba-inc.com/corpora/arena/label" rel="noopener noreferrer"&gt;AI Arena&lt;/a&gt; - an open-source benchmark platform based on the Elo rating system. AI Arena provides a fair, transparent, and dynamic evaluation environment for continuous comparison of different models. In each round of evaluation, the system generates two anonymous images based on the same prompt, inviting users to compare them and vote. The voting results are used to update individual and global leaderboards in real-time via the Elo algorithm, enabling a scientific, data-driven assessment of model performance. AI Arena is now open to the public.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fj8bgwjtuxel84pvicyom.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fj8bgwjtuxel84pvicyom.png" width="800" height="466"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  Free Online Platforms:
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;a href="https://chat.qwen.ai/" rel="noopener noreferrer"&gt;qwen chat&lt;/a&gt;: Tongyi's intelligent conversation platform. Select &lt;code&gt;Image Generation&lt;/code&gt; during a chat; it can be slow at times.&lt;/li&gt;
&lt;li&gt;
&lt;a href="https://huggingface.co/spaces/Qwen/Qwen-Image" rel="noopener noreferrer"&gt;huggingface&lt;/a&gt;: Can be slow.&lt;/li&gt;
&lt;li&gt;
&lt;a href="https://kontextflux.io/image-models/qwen-image" rel="noopener noreferrer"&gt;qwen-image&lt;/a&gt;: Get 20 credits upon registration.&lt;/li&gt;
&lt;li&gt;
&lt;a href="https://wavespeed.ai/" rel="noopener noreferrer"&gt;wavespeed&lt;/a&gt;: Get 50 generation credits upon registration.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  Resources
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;GitHub:&lt;/strong&gt; &lt;a href="https://github.com/QwenLM/Qwen-Image" rel="noopener noreferrer"&gt;https://github.com/QwenLM/Qwen-Image&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Hugging Face:&lt;/strong&gt; &lt;a href="https://huggingface.co/Qwen/Qwen-Image" rel="noopener noreferrer"&gt;https://huggingface.co/Qwen/Qwen-Image&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Official Blog:&lt;/strong&gt; &lt;a href="https://qwenlm.github.io/blog/qwen-image/" rel="noopener noreferrer"&gt;https://qwenlm.github.io/blog/qwen-image/&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Technical Report&lt;/strong&gt; &lt;a href="https://arxiv.org/abs/2508.02324" rel="noopener noreferrer"&gt;https://arxiv.org/abs/2508.02324&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Discord&lt;/strong&gt; &lt;a href="https://discord.gg/CV4E9rpNSD" rel="noopener noreferrer"&gt;discord&lt;/a&gt;
&lt;/li&gt;
&lt;/ul&gt;

</description>
      <category>qwenimage</category>
    </item>
    <item>
      <title>保姆级教程教你用ai实现labubu自由</title>
      <dc:creator>Yang ella</dc:creator>
      <pubDate>Mon, 16 Jun 2025 07:33:53 +0000</pubDate>
      <link>https://dev.to/yang_ella_f2a3e16ccb54550/bao-mu-ji-jiao-cheng-jiao-ni-yong-aishi-xian-labubuzi-you-j2d</link>
      <guid>https://dev.to/yang_ella_f2a3e16ccb54550/bao-mu-ji-jiao-cheng-jiao-ni-yong-aishi-xian-labubuzi-you-j2d</guid>
      <description>&lt;p&gt;labubu太火热，实体店难买，二手太贵，本文教你用 Labubu Doll Generator Lora, 借助together ai的免费api，通过简单的提示词生成我们想要的labubu图片。&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;本文涉及基本python代码，若不想自己折腾，可以在线体验： &lt;a href="https://fluxkontext.xyz/image-generator/ai-labubu-generator" rel="noopener noreferrer"&gt;ai-labubu-generator&lt;/a&gt;&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F0orivtyekx5v1nml9esz.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F0orivtyekx5v1nml9esz.png" alt=" " width="800" height="553"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;简略步骤：&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;获取 Labubu lora 链接&lt;/li&gt;
&lt;li&gt;注册together ai 获取免费1美元api额度&lt;/li&gt;
&lt;li&gt;python调用api生成图片&lt;/li&gt;
&lt;/ol&gt;

&lt;h2&gt;
  
  
  获取 Labubu lora 链接
&lt;/h2&gt;

&lt;p&gt;lora 路径： &lt;a href="https://huggingface.co/spaces/yeekal/lbb_lora/resolve/main/flux_lbb_style_v1_2ksteps.safetensors?download=true" rel="noopener noreferrer"&gt;https://huggingface.co/spaces/yeekal/lbb_lora/resolve/main/flux_lbb_style_v1_2ksteps.safetensors?download=true&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;我们不用下载到本地，这个链接后面会作为一个参数传入到together ai 里面。&lt;/p&gt;

&lt;p&gt;除非你是本地部署模型lora，需要下载&lt;/p&gt;

&lt;h2&gt;
  
  
  注册together ai
&lt;/h2&gt;

&lt;p&gt;这一步主要是获取together api的密钥&lt;/p&gt;

&lt;p&gt;访问&lt;a href="https://www.together.ai/" rel="noopener noreferrer"&gt;together.ai&lt;/a&gt;注册，注册完成之后进入到个人账号页面，点击Dashboard，可以看到赠送的1美元额度。如下图左侧&lt;code&gt;API Keys&lt;/code&gt;, 点击复制密钥&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F4ovpcq7jcl0vz30opti6.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F4ovpcq7jcl0vz30opti6.png" width="800" height="394"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  python 调用
&lt;/h2&gt;

&lt;p&gt;安装together 依赖&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;pip install --upgrade together&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;调用 together api:&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;copy 代码&lt;/li&gt;
&lt;li&gt;修改密钥api_key&lt;/li&gt;
&lt;li&gt;修改提示词&lt;/li&gt;
&lt;li&gt;运行，等待5-10s即可出结果
&lt;/li&gt;
&lt;/ol&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight python"&gt;&lt;code&gt;&lt;span class="kn"&gt;from&lt;/span&gt; &lt;span class="n"&gt;together&lt;/span&gt; &lt;span class="kn"&gt;import&lt;/span&gt; &lt;span class="n"&gt;Together&lt;/span&gt;

&lt;span class="c1"&gt;# Set the API key directly in the client
&lt;/span&gt;&lt;span class="n"&gt;client&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="nc"&gt;Together&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;api_key&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;""&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt; &lt;span class="c1"&gt;# 设置密钥
&lt;/span&gt;
&lt;span class="nf"&gt;help&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;client&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;images&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;generate&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="n"&gt;response&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;client&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;images&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;generate&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="c1"&gt;# 设置自己的提示词
&lt;/span&gt;    &lt;span class="n"&gt;prompt&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;Labubu style, walking on street with a pack&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="c1"&gt;#"labubu style, an astronaut",
&lt;/span&gt;    &lt;span class="c1"&gt;# 基模，不用改
&lt;/span&gt;    &lt;span class="n"&gt;model&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;black-forest-labs/FLUX.1-dev-lora&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;width&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="mi"&gt;768&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;height&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="mi"&gt;1024&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;image_loras&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;
    &lt;span class="p"&gt;{&lt;/span&gt;
      &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;path&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;https://huggingface.co/spaces/yeekal/lbb_lora/resolve/main/flux_lbb_style_v1_2ksteps.safetensors?download=true&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
      &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;scale&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="mf"&gt;0.8&lt;/span&gt;
    &lt;span class="p"&gt;}&lt;/span&gt;
  &lt;span class="p"&gt;],&lt;/span&gt;
    &lt;span class="n"&gt;steps&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="mi"&gt;30&lt;/span&gt;
&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="c1"&gt;# 生成之后会返回一个图片url链接，点击即可看到结果
&lt;/span&gt;&lt;span class="nf"&gt;print&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;response&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;data&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="mi"&gt;0&lt;/span&gt;&lt;span class="p"&gt;].&lt;/span&gt;&lt;span class="n"&gt;url&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;图片中的宽高可以自定义设置，但是根据together ai的收费说明，图片越大，费用越贵。代码里面默认设置的&lt;code&gt;768x1024&lt;/code&gt;清晰度也够用了，可以不用改，下面的图都是这个尺寸，可以参照以下。&lt;br&gt;
&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F11utq4uuh2am2hae3izs.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F11utq4uuh2am2hae3izs.png" width="800" height="547"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  生成结果展示
&lt;/h2&gt;

&lt;blockquote&gt;
&lt;p&gt;&lt;strong&gt;懒人试用链接: &lt;a href="https://fluxkontext.xyz/image-generator/ai-labubu-generator" rel="noopener noreferrer"&gt;ai-labubu-generator&lt;/a&gt;&lt;/strong&gt;&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fjby2wr6ijt0tgzng4mne.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fjby2wr6ijt0tgzng4mne.png" alt=" " width="800" height="524"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Flm6ev6st5e7yfuu3d9hq.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Flm6ev6st5e7yfuu3d9hq.png" alt=" " width="800" height="535"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Ft9fgh6104j9711ulw86d.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Ft9fgh6104j9711ulw86d.png" width="768" height="1024"&gt;&lt;/a&gt;&lt;br&gt;
&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fkq9wprytgx3d26wzpi94.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fkq9wprytgx3d26wzpi94.png" width="768" height="1024"&gt;&lt;/a&gt;&lt;br&gt;
&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F4y5uoc26ju9xzq5nxz6l.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F4y5uoc26ju9xzq5nxz6l.png" width="768" height="1024"&gt;&lt;/a&gt;&lt;br&gt;
&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F29yvu48cln79yh2u8mt5.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F29yvu48cln79yh2u8mt5.png" width="768" height="1024"&gt;&lt;/a&gt;&lt;br&gt;
&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fvdd4e5ifee9itfipmj7n.jpg" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fvdd4e5ifee9itfipmj7n.jpg" width="800" height="800"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;懒人试用链接: &lt;a href="https://fluxkontext.xyz/image-generator/ai-labubu-generator" rel="noopener noreferrer"&gt;fluxkontext.xyz&lt;/a&gt;&lt;/strong&gt;&lt;/p&gt;

</description>
    </item>
  </channel>
</rss>
