本週一句話摘要: 這兩週最重要的不是哪個模型又強了一點,而是 OpenAI 與 Microsoft 的合作邊界開始重畫;後面的 AWS、FedRAMP、PwC、廣告、Claude 垂直代理、Google Gemini 場景化,都像是同一件事的不同側面:AI 公司正在把「模型能力」改造成「可被企業採購、治理、部署、付費」的完整控制面。
1. OpenAI 和 Microsoft:最結構性的變化不是八卦,是控制權
本期最重要的事件,是 OpenAI 與 Microsoft 的合作進入下一階段。OpenAI 自己發布了「Microsoft OpenAI partnership」下一階段說明 The next phase of the Microsoft OpenAI partnership - OpenAI;CNBC 的標題直接點出 OpenAI 調整與 Microsoft 的合作,並對 revenue share payment 設上限 OpenAI shakes up partnership with Microsoft, capping revenue share payments - CNBC;NYT 用「loosen their partnership」描述這個變化 Microsoft and OpenAI Loosen Their Partnership - nytimes.com;WSJ 則從另一側補了一刀:OpenAI 在衝刺 IPO 的高壓期,錯過部分收入與用戶目標 OpenAI Misses Key Revenue, User Targets in High-Stakes Sprint Toward IPO - WSJ。NYT 另一篇問題更直接:OpenAI 是否正在 AI 競賽中落後 Is OpenAI Falling Further Behind in the A.I. Race? - nytimes.com。
這不是「Microsoft vs OpenAI」的公司八卦。它直接影響工程落地:誰控制雲端部署、誰控制企業合約、誰拿到模型與產品的 IP 上限、誰承擔算力資本支出,最後都會回到客戶能不能穩定採購、能不能跨雲部署、能不能把模型放進既有治理流程。
可以用三層看這個重排:
| 層級 | 對企業客戶的實際影響 |
|---|---|
| 商業分潤 | revenue share 上限代表利益綁定可能下降,OpenAI 需要更多自有收入入口 |
| 雲端部署 | 合作鬆動後,OpenAI 更有動機走多雲與直接企業部署 |
| 產品控制 | 若 IPO 與成長壓力同步上升,OpenAI 會更快把模型能力包成可銷售產品 |
這也是為什麼本期不能只看單一發布。OpenAI 接下來一串動作都像補位:AWS、FedRAMP、PwC、ChatGPT ads、Codex orchestration,方向很一致。
2. OpenAI 的補位:從模型公司變成部署與收入控制面
OpenAI 在這兩週同時推了幾條線,但每一條都不只是「多一個功能」。
第一條是雲與企業部署。OpenAI 宣布其模型、Codex 與 Managed Agents 進入 AWS OpenAI models, Codex, and Managed Agents come to AWS - OpenAI。對企業來說,這比單純「又支援一個模型」重要:AWS 是既有採購、權限、網路、資料治理與成本控管的主場。OpenAI 若要降低對單一雲端合作夥伴的依賴,多雲入口是必需品,不是加分項。
第二條是政府與合規。OpenAI 宣布達到 FedRAMP Moderate OpenAI available at FedRAMP Moderate - OpenAI。FedRAMP 不是能力 benchmark,而是採購門檻。它代表產品開始能進入一部分公共部門與受管制企業的標準流程。這種進展不會像新模型一樣有展示效果,但對商業化更硬。
第三條是工作流與財務場景。OpenAI 與 PwC 合作重塑 CFO office OpenAI and PwC collaborate to reimagine the office of the CFO - OpenAI,PwC 也發布了「OpenAI Native Finance Function」說明 PwC and OpenAI Build a First-of-Its-Kind OpenAI Native Finance Function - PwC。CFO 場景不是聊天機器人的自然延伸,它要求權限、審計、資料 lineage、人工覆核與系統整合。這裡的真正問題不是模型能不能寫出財務分析,而是它能不能被放進現有 ERP、報表、審批與風控鏈。
第四條是開發者與代理編排。OpenAI 發布 Symphony 這個 Codex orchestration 開源規格 An open-source spec for Codex orchestration: Symphony. - OpenAI,並另外談了大規模訓練的 supercomputer networking Supercomputer networking to accelerate large scale AI training - OpenAI。前者是工具鏈控制,後者是基礎設施控制。把兩件事放一起看,OpenAI 在補的是上下兩層:上層讓 agent workflow 可被描述與編排,下層確保訓練與推理供給能支撐產品節奏。
第五條是收入入口。OpenAI 發布 ChatGPT ads 的新購買方式 New ways to buy ChatGPT ads - OpenAI,也同步有 ad policies Ad policies - OpenAI。這件事很容易被看成「廣告化」爭議,但工程決策者應該看另一個點:如果 ChatGPT 變成可投放、可衡量、可採購的商業入口,OpenAI 的產品就不只賣 API 或訂閱,而是直接碰到 demand generation。這會改變產品優先順序,也會改變企業客戶對資料使用、品牌安全與治理的要求。
這一組動作的共同語言是:OpenAI 需要更少依賴單一夥伴,更多掌握自己的部署、合規、工作流與營收入口。它不是同時做很多事,而是在補「合作鬆動」之後必須自己承擔的控制面。
3. Anthropic 的垂直代理週:進企業現場,也承認成本與可靠性問題
Anthropic 這兩週的節奏也很清楚:把 Claude 從通用聊天推進垂直工作流。
安全場景最密集。Claude Security 從 closed preview 走出來,主打掃描 codebase vulnerability Anthropic's Claude Security emerges from closed preview to scan your codebases for vulnerabilities - The New Stack,SecurityWeek 也以「counter AI-powered exploit surge」描述這個發布 Anthropic Unveils Claude Security to Counter AI-Powered Exploit Surge - SecurityWeek,CRN 做了企業採購角度整理 Anthropic Launches Claude Security: 5 Things To Know - crn.com。這是合理的切入點:安全團隊本來就有大量 triage、掃描、審查與修補流程,agent 若能接在既有 repository、ticket 與 CI/CD 上,落地價值比一般聊天更容易被量化。
金融與專業服務是第二條線。Anthropic 發布 Agents for financial services Agents for financial services - Anthropic,同週又宣布與 Blackstone、Hellman & Friedman、Goldman Sachs 建立新的 enterprise AI services company Building a new enterprise AI services company with Blackstone, Hellman & Friedman, and Goldman Sachs - Anthropic。如果把這兩件事連起來看,Anthropic 不是只想賣模型給金融業,而是想把模型包進顧問、合規、資料治理與專業服務渠道。這會比較慢,但採購阻力也比較低。
創作與開發者工作流是第三條線。Claude for Creative Work Claude for Creative Work - Anthropic 與 Claude Code Auto Mode 的 human approval gates Inside Claude Code Auto Mode: Anthropic’s Autonomous Coding System with Human Approval Gates - infoq.com 指向同一個產品哲學:讓 agent 做更多,但保留明確的人類批准點。這比「完全自動」更像企業會採購的形態。能自動很吸引人,但能被審計、能被中止、能留下決策痕跡,才是進 production 的必要條件。
但 Anthropic 這週最值得寫的不是漂亮發布,而是兩個負面訊號。Business Insider 報導 Anthropic 悄悄把工程師使用 Claude Code token 成本預估調高到 2 倍 Anthropic quietly doubles its estimate for how much engineers can expect to spend on Claude Code tokens - Business Insider;Fortune 報導 Anthropic 承認工程失誤造成 Claude Code 長達一個月的下降,之前已累積多週使用者反彈 Anthropic says engineering missteps were behind Claude Code’s monthlong decline after weeks of user backlash - Fortune。這兩件事應該被放在發布旁邊看,而不是埋在角落。
| Anthropic 訊號 | 正面解讀 | 必須面對的成本 |
|---|---|---|
| Claude Security | 安全 triage 可進 workflow | false positive、修補責任、CI 整合成本 |
| Financial services agents | 金融業有高價值流程 | 合規、資料隔離、審計與人工覆核 |
| Claude Code Auto Mode | 自動化更強且保留 approval gates | token 成本、可靠性、rollback 與責任歸屬 |
| Claude Code 成本/品質負面訊號 | 公司願意承認現實問題 | agent 仍會被 latency、成本與穩定性卡住 |
這裡的判斷很直接:Anthropic 的企業策略是對的,但 Claude Code 的成本與品質波動提醒我們,agent 還不是「開了就省人力」的工具。它更像是一個需要 SRE 心態管理的新工作流元件:要觀測、要限額、要 approval gates、要 fallback。
4. Google 的壓力測試:Gemini 要證明自己不是只會被塞進每個入口
Google 這兩週的故事,是把 Gemini 往各種場景放,但市場會追問:哪些是真的 workflow,哪些只是入口展示?
最有技術含量的是 Google DeepMind 的 AlphaEvolve,標題直接說是 Gemini-powered coding agent,並強調 across fields 的 scaling impact AlphaEvolve: Gemini-powered coding agent scaling impact across fields - Google DeepMind。這類發布需要小心讀:如果只是研究展示,它代表技術方向;如果能進內部或外部工程流程,才代表產品化。對讀者最該問的不是 benchmark,而是它接不接 issue tracker、repo、CI、review policy,以及錯誤時誰負責。
車載是另一個高價值場景。GM 宣布把 Google Gemini 帶到路上數百萬台車 GM brings Google Gemini to millions of vehicles on the road - General Motors,Google blog 也說 built-in Google 車輛會因 Gemini 變聰明 Your car with Google built-in is about to get smarter, thanks to Gemini - blog.google。車載 AI 的價值不在閒聊,而在導航、車況、語音控制與服務整合;限制也很硬:latency、離線能力、隱私、駕駛分心與責任歸屬。這是 Gemini 能否離開手機 UI、進入實體產品的一次測試。
醫療則更敏感。Google DeepMind 發布 AI co-clinician 研究 AI co-clinician: researching the path toward AI-augmented care - Google DeepMind。這類題目必須明確標成研究,而不是產品。臨床場景的門檻是驗證、責任、資料治理與醫師 workflow,不是 demo 看起來像醫生。
消費端則是 Gemini app 的功能堆疊:April Gemini Drop Find out what’s new in the Gemini app in April's Gemini Drop. - blog.google、生成 Google Docs/PDF/Word 等檔案 Gemini app can now generate Google Docs, PDF, Word, and other files - 9to5GoogleYou can now easily generate files in Gemini. - blog.google、personalisation features Gemini launches new personalisation features in the UK - blog.google、Proactive Assistance 與新語音準備中 Gemini app preps ‘Proactive Assistance’ and new Gemini voices - 9to5Google、使用限制與 AI Ultra Lite plan Google readies ‘AI Ultra Lite’ plan and explicit ‘usage limits’ for Gemini - 9to5Google。這些都指向同一件事:Google 正在把 Gemini 做成日常入口,但入口多不等於落地深。真正的考驗是使用者會不會把它放進重複工作,而不是偶爾試一次。
最後,Business Insider 報導 Google 正在打造可能回答 OpenClaw 的 AI agent Google Is Building an AI Agent That Could Be Its Answer to OpenClaw - Business Insider,9to5Google 也提到 Gemini Agent 作為「24/7 digital partner」的跡象 Google preps ‘Gemini Agent’ as your ’24/7 digital partner’ - 9to5Google。這一組消息如果成真,Google 會正面進入 agent OS 競爭。但在沒有正式產品前,只能視為方向訊號。
5. 本期結論:AI 公司正在從模型競賽,轉向控制面競賽
把 04-25 到 05-08 的事件放在一起,主線不是「OpenAI、Anthropic、Google 誰贏」。更精準的說法是:三家公司都在把模型能力接到控制面。
- OpenAI 的控制面是雲、政府合規、企業財務 workflow、廣告入口與代理編排。
- Anthropic 的控制面是安全、金融、創作與 coding agent,但它也被 token 成本與可靠性提醒。
- Google 的控制面是既有入口:車、Docs、Gemini app、醫療研究、coding agent 與可能的 personal agent。
對工程決策者,本週最實用的判斷是:
- 不要只買模型能力,要看部署權。 AWS、FedRAMP、企業服務合作比模型分數更接近採購現場。
- 不要把 agent 當省人成本承諾。 Claude Code 的 2 倍 token 成本預估與一個月品質下降,是很好的反例。
- 不要把入口當 workflow。 Google 把 Gemini 放進更多地方,但只有接上資料、權限、審計、回滾與責任鏈,才算真正落地。
- 不要低估商業入口的影響。 ChatGPT ads 會改變 OpenAI 的產品優先順序,也會帶來資料使用與品牌安全問題。
這期最值得記住的一句話:模型競賽沒有消失,但真正會改變企業採購的,是誰能控制部署、合規、成本、工作流與收入入口。
stance: 2026-05-08 這期的主線是 AI 公司從模型能力競賽轉向控制面競賽;MS-OpenAI 重排是核心,企業部署、垂直代理與 Gemini 場景化都是後續反應。
key_links:
- https://openai.com/index/next-phase-of-microsoft-partnership/
- https://openai.com/index/openai-on-aws/
- https://www.infoq.com/news/2026/05/anthropic-claude-code-auto-mode/
- https://deepmind.google/blog/alphaevolve-impact/
Top comments (0)