本週一句話摘要:當模型層的差距縮到誤差範圍內,真正的競爭轉到工作流、供應鏈、與監管曝險——Claude Science 與 OpenAI 政府股權是這週最清楚的兩條訊號線。
垂直工具壓進工作流
Anthropic 推出 Claude Science,把文獻搜尋、引用核對、實驗設計的循環收進同一介面 Claude Science, an AI workbench for scientists, is now available - AnthropicAnthropic releases Claude Science, a product aimed at researchers, the pharma industry - STAT。取代既有解法(檢索工具+Notion+Zotero 組合)的關鍵是引用準確率與權限隔離——目前廠商宣稱已與數家藥廠導入 Anthropic releases Claude Science, a product aimed at researchers, the pharma industry - STAT,但「發布」「可商用」「可被稽核」三者之間還有距離。企業卡點會落在合規與可重現性,不是對話品質。
Google 端把 Gemini Spark 推上桌面 Gemini Spark updates: macOS launch, connected apps and more - blog.googleGemini Spark Comes To Google's Gemini App For macOS - Engadget,並讓 Gemini App 在 Google Play 內用對話方式推薦 App Gemini’s new Google Play Store integration lets you chat to find Android apps, games - 9to5Google。Spark 是連線本機與雲端 App 的代理層 Google's Gemini AI Can Do a Lot, But Here Are 15 Features You'll Actually Use - PCMag,這次的差異是「常駐」——可 24/7 排程。對開發者是新整合介面(hooks、triggers、權限範圍),對終端使用者是把代理從一次性任務推成背景行程。可用與可商用之間仍隔著延遲、權限顆粒度、錯誤率。
開源端用成本結構決勝負
GLM 5.2 在第三方評測中接近 Opus 4.8 的編碼分數,定價僅其五分之一 GLM 5.2 - The first open source AI model I'm actually keeping - KorbenZhipu’s GLM 5.2 Rivals Opus 4.8 on Coding Benchmarks at a Fifth of the Cost - Technology Org。編碼基準帶敘事目的,數字本身要打折;但本週新訊號是價格錨點被壓到五分之一這個量級,這是 2026-06-18 與 2026-06-11 兩週報過的「成本結構取代能力」論點的第一個具體落錨——能力差異收斂到誤差範圍時,企業選擇模型的第一變數就從能力切到延遲、佈署、私有化合規。對廠商提案的直接含意:不要再以「最聰明」作為唯一賣點。
算力與監管:國家級曝險
供應鏈側: 韓國宣佈上看 5760 億美元的 AI 晶片投資計畫,主軸是 Samsung 與 SK Hynix Korea taps Samsung, SK Hynix in $576 billion AI-chip drive to cement global leadership - Yahoo FinanceSouth Korea plans massive AI and chip investment drive worth up to $648 billion - Crypto Briefing——地緣風險被正式定價,供應鏈多元化從錦上添花變成評分項。同一時間,新創 Etched 以專注 Transformer 推論的 ASIC 衝到 50 億美元估值與 10 億美元銷售 Nvidia competitor Etched hits $5B valuation, $1B in sales for AI chip - TechCrunch,押注「繞過 Nvidia 生態」。架構若綁定單一工作負載,延遲與能耗可壓到數倍以下,但代價是失去通用性。評估時應問「你的工作負載是否與該 ASIC 同形」,不是看帳面數字。
監管側: OpenAI 傳出擬以 5% 股權與美國政府換監管彈性 OpenAI proposes 5% stake to Trump administration to ease Washington pressure: Report - CNBCOpenAI in talks to give Trump administration a 5% stake in the company, FT reports - CNN。當模型供應商被政治綁定,API 合約與資料落地政策變數上升,企業選商時應把「監管不確定性」列入供應商評分——這條訊號線與 Claude Science 是本週兩端:前者把科學流程收進產品介面,後者把產品介面交給監管框架。
使用者行為的臨界點
CNBC 觀察到使用者從「衝 token 量」轉向「效率優先」OpenAI and Anthropic face new AI reality as users shift from 'tokenmaxxing' to efficiency - CNBC,OpenAI 營收主管把企業端採用描述為「tipping point」OpenAI and Anthropic face new AI reality as users shift from 'tokenmaxxing' to efficiency - CNBC。兩個訊號合在一起是同一件事:模型層差異正在變窄,企業真正卡的是整合、可靠性、單位成本。Benchmark 神話退場後,工程決策會更看一次任務的平均重試次數、P95 延遲、上下文有效利用率、與既有系統的對接成本。
工程選商 checklist(本週更新)
| 評估維度 | 本週訊號 | 實際取捨 |
|---|---|---|
| 模型能力 | GLM 5.2 逼近頂級 GLM 5.2 - The first open source AI model I'm actually keeping - KorbenZhipu’s GLM 5.2 Rivals Opus 4.8 on Coding Benchmarks at a Fifth of the Cost - Technology Org | 能力差異收斂,成本與合規成主變數 |
| 工作流整合 | Claude Science Claude Science, an AI workbench for scientists, is now available - Anthropic、Spark Gemini Spark updates: macOS launch, connected apps and more - blog.google 進入常駐 | 看 hooks、權限、稽核軌跡,不是看 demo |
| 供應鏈 | 韓國 576B 計畫 Korea taps Samsung, SK Hynix in $576 billion AI-chip drive to cement global leadership - Yahoo Finance、Etched 50 億 Nvidia competitor Etched hits $5B valuation, $1B in sales for AI chip - TechCrunch | 地緣與單一工作負載適配性列入評分 |
| 監管曝險 | OpenAI 5% OpenAI proposes 5% stake to Trump administration to ease Washington pressure: Report - CNBCOpenAI in talks to give Trump administration a 5% stake in the company, FT reports - CNN | 把供應商監管風險列入合約條款 |
一句話給決策者:當通用模型變成大宗商品,價值會往「知道怎麼把它接進既有系統」的人集中——這週起,模型選商與系統整合商選商正在收斂成同一個問題。
Top comments (0)