AI 週報 — 2026-06-26 to 2026-07-03 | 從 token 競量到工作流競深

#ai #machinelearning #tech #llm

本週一句話摘要：當模型層的差距縮到誤差範圍內，真正的競爭轉到工作流、供應鏈、與監管曝險——Claude Science 與 OpenAI 政府股權是這週最清楚的兩條訊號線。

垂直工具壓進工作流

Anthropic 推出 Claude Science，把文獻搜尋、引用核對、實驗設計的循環收進同一介面 Claude Science, an AI workbench for scientists, is now available - Anthropic Anthropic releases Claude Science, a product aimed at researchers, the pharma industry - STAT。取代既有解法（檢索工具＋Notion＋Zotero 組合）的關鍵是引用準確率與權限隔離——目前廠商宣稱已與數家藥廠導入 Anthropic releases Claude Science, a product aimed at researchers, the pharma industry - STAT，但「發布」「可商用」「可被稽核」三者之間還有距離。企業卡點會落在合規與可重現性，不是對話品質。

Google 端把 Gemini Spark 推上桌面 Gemini Spark updates: macOS launch, connected apps and more - blog.google Gemini Spark Comes To Google's Gemini App For macOS - Engadget，並讓 Gemini App 在 Google Play 內用對話方式推薦 App Gemini’s new Google Play Store integration lets you chat to find Android apps, games - 9to5Google。Spark 是連線本機與雲端 App 的代理層 Google's Gemini AI Can Do a Lot, But Here Are 15 Features You'll Actually Use - PCMag，這次的差異是「常駐」——可 24/7 排程。對開發者是新整合介面（hooks、triggers、權限範圍），對終端使用者是把代理從一次性任務推成背景行程。可用與可商用之間仍隔著延遲、權限顆粒度、錯誤率。

開源端用成本結構決勝負

GLM 5.2 在第三方評測中接近 Opus 4.8 的編碼分數，定價僅其五分之一 GLM 5.2 - The first open source AI model I'm actually keeping - Korben Zhipu’s GLM 5.2 Rivals Opus 4.8 on Coding Benchmarks at a Fifth of the Cost - Technology Org。編碼基準帶敘事目的，數字本身要打折；但本週新訊號是價格錨點被壓到五分之一這個量級，這是 2026-06-18 與 2026-06-11 兩週報過的「成本結構取代能力」論點的第一個具體落錨——能力差異收斂到誤差範圍時，企業選擇模型的第一變數就從能力切到延遲、佈署、私有化合規。對廠商提案的直接含意：不要再以「最聰明」作為唯一賣點。

算力與監管：國家級曝險

供應鏈側： 韓國宣佈上看 5760 億美元的 AI 晶片投資計畫，主軸是 Samsung 與 SK Hynix Korea taps Samsung, SK Hynix in $576 billion AI-chip drive to cement global leadership - Yahoo Finance South Korea plans massive AI and chip investment drive worth up to $648 billion - Crypto Briefing——地緣風險被正式定價，供應鏈多元化從錦上添花變成評分項。同一時間，新創 Etched 以專注 Transformer 推論的 ASIC 衝到 50 億美元估值與 10 億美元銷售 Nvidia competitor Etched hits $5B valuation, $1B in sales for AI chip - TechCrunch，押注「繞過 Nvidia 生態」。架構若綁定單一工作負載，延遲與能耗可壓到數倍以下，但代價是失去通用性。評估時應問「你的工作負載是否與該 ASIC 同形」，不是看帳面數字。

監管側： OpenAI 傳出擬以 5% 股權與美國政府換監管彈性 OpenAI proposes 5% stake to Trump administration to ease Washington pressure: Report - CNBC OpenAI in talks to give Trump administration a 5% stake in the company, FT reports - CNN。當模型供應商被政治綁定，API 合約與資料落地政策變數上升，企業選商時應把「監管不確定性」列入供應商評分——這條訊號線與 Claude Science 是本週兩端：前者把科學流程收進產品介面，後者把產品介面交給監管框架。

使用者行為的臨界點

CNBC 觀察到使用者從「衝 token 量」轉向「效率優先」OpenAI and Anthropic face new AI reality as users shift from 'tokenmaxxing' to efficiency - CNBC，OpenAI 營收主管把企業端採用描述為「tipping point」OpenAI and Anthropic face new AI reality as users shift from 'tokenmaxxing' to efficiency - CNBC。兩個訊號合在一起是同一件事：模型層差異正在變窄，企業真正卡的是整合、可靠性、單位成本。Benchmark 神話退場後，工程決策會更看一次任務的平均重試次數、P95 延遲、上下文有效利用率、與既有系統的對接成本。

工程選商 checklist（本週更新）

評估維度	本週訊號	實際取捨
模型能力	GLM 5.2 逼近頂級 GLM 5.2 - The first open source AI model I'm actually keeping - Korben Zhipu’s GLM 5.2 Rivals Opus 4.8 on Coding Benchmarks at a Fifth of the Cost - Technology Org	能力差異收斂，成本與合規成主變數
工作流整合	Claude Science Claude Science, an AI workbench for scientists, is now available - Anthropic、Spark Gemini Spark updates: macOS launch, connected apps and more - blog.google 進入常駐	看 hooks、權限、稽核軌跡，不是看 demo
供應鏈	韓國 576B 計畫 Korea taps Samsung, SK Hynix in $576 billion AI-chip drive to cement global leadership - Yahoo Finance、Etched 50 億 Nvidia competitor Etched hits $5B valuation, $1B in sales for AI chip - TechCrunch	地緣與單一工作負載適配性列入評分
監管曝險	OpenAI 5% OpenAI proposes 5% stake to Trump administration to ease Washington pressure: Report - CNBC OpenAI in talks to give Trump administration a 5% stake in the company, FT reports - CNN	把供應商監管風險列入合約條款