韩

Posted on Apr 25

DeepSeek V4 核爆之后：开源 AI 真的在颠覆市场，还是只是泡沫？

DeepSeek V4 在 HN 拿下了 1912 分、1480 条评论——这是今年所有 AI 新闻里讨论最热烈的一次。

与此同时，Reddit r/artificial 上一条"开源 AI vs Big Tech：真实颠覆还是纯炒作？"的帖子引发了激烈争论。Google 刚刚宣布向 Anthropic 投资高达 400 亿美元。AI 市场的格局，正在以肉眼可见的速度重构。

但实际情况是什么样的？我扒了 HN 热帖、Reddit 讨论、GitHub 高星项目，以及几家大厂的最新动向，结论可能跟你想的不太一样。

开源 AI 的真实冲击力：从三个维度来看

维度一：价格战 — 这才是真正的"颠覆"

Reddit 上有开发者做了实测对比：

模型	1000 Token 输出成本	128K 上下文支持
GPT-4o	~$0.03	✅
Claude 3.7	~$0.015	✅
DeepSeek V4	~$0.0014	✅

成本差了 20 倍。这不是边际优化，这是结构性破坏。

很多团队以为"大厂有基础设施优势"——但当推理成本降到原来的 5%，基础设施规模的护城河就薄了很多层。Reddit 热评里有人说："DeepSeek 正在做的是让 AI 基础设施commoditize，这和当年 Linux 把服务器操作系统白菜价是一个逻辑。"

但要注意：DeepSeek V4 在超过 60K token 后质量有明显衰减，复杂推理任务里仍然不如 Claude。换句话说：简单任务被颠覆，复杂任务还有差距。

维度二：开发者生态 — 真正的竞争才刚刚开始

GitHub 上最热的 AI 项目里，DeepSeek 相关仓库的 star 增速远超预期。但更值得看的是 开发者用什么构建。

我统计了 HN 和 Reddit 讨论里提到的开发栈：

高频出现的开源模型工具链：
├── Ollama（本地推理） — 热度持续上升
├── LiteLLM（统一调用接口） — 正在成为事实标准
├── VLLM（高吞吐推理） — 部署必备
├── Axolotl / Unsloth（微调） — 企业定制化需求爆发
└── Dify / n8n（工作流编排） — 低代码 AI 应用层快速扩张

有意思的是，Reddit 讨论里有人指出：DeepSeek 的崛起实际上带动了 整个开源生态 的热度，因为大家在问"哪个框架调用 DeepSeek 最稳定"，连带把 Ollama、LiteLLM 这些工具的曝光度也拉起来了。

维度三：模型能力 — 基准测试之外的真相

Dev.to 上有一篇热门帖子专门分析 GPT-5.5 在 LiveBench 上的表现——号称"史上最强 Agent 编程模型"，实测排名只有第 11 位，比前代 GPT-5.4 还低。

DeepSeek V4 也面临同样的问题：基准测试和真实使用体验之间有差距。

Reddit 上有个评论很到位：

"DeepSeek V4 的亮点是价格和 MTP 架构带来的吞吐量提升，但它的 MOO（Mixture of Experts）负载均衡在生产环境里还不够稳定。周末跑批处理没问题，周一高峰期容易超时。"

这是模型本身的问题，不是开源 vs 闭源的路线问题。

Google 400 亿美元押注 Anthropic：意味着什么？

Google 宣布投资 400 亿美元给 Anthropic，这是 AI 领域有史以来最大的单笔投资之一。这个消息在 HN 上拿到了 586 分。

这说明什么？

Big Tech 不打算让开源 AI 独享定价权 — Google 需要 Anthropic 的 Claude 系列来守住高端市场
DeepSeek 的价格冲击让大厂更愿意砸钱 — 与其降价竞争，不如通过投资绑定下一代模型
多强格局正在形成 — OpenAI、Google、Anthropic、DeepSeek 四足鼎立，这对开发者来说其实是好事：API 价格会持续下降。

普通开发者现在该怎么做？

综合 HN 和 Reddit 的讨论，我提炼出三个务实建议：

建议一：采用分层模型策略

简单任务（摘要、翻译、格式化）→ DeepSeek V4  # 便宜、快速
中等复杂度（代码审查、数据分析）→ Claude 3.7 # 质量稳定
高风险任务（安全审计、法律文档）→ GPT-4o     # 上下文最可靠

Reddit 有个开发者分享说，他的团队把 AI 调用成本从每月 $800 降到了 $120，方法就是"把 70% 的请求路由到 DeepSeek"。

建议二：关注推理基础设施，而不是模型本身

HN 上有个被顶上去的评论说得好：

"现在最值钱的技能不是'用哪个模型'，而是'怎么让模型输出稳定、可验证、可观测'。这才是 infra 层的竞争。"

这对应了最近几个高星项目：VLLM（推理加速）、Ollama（本地化部署）、Surrealdb（AI Agent 数据库）——这些工具在模型层之下默默积累着价值。

建议三：盯住 Agentic AI 的实际落地瓶颈

Reddit 上有个关于 AI Alignment 的深度帖子值得关注——它指出当前 AI Agent 最大的问题不是模型能力，而是规划可靠性和安全边界。

对于普通开发者来说，这意味着：与其追最新模型，不如把精力放在 Agent 框架的稳定性和监控上。Cursor、Claude Code 这些工具之所以火，不是因为模型多强，而是因为它们把 Agent 的错误率降到了可用范围。

结语：这不是"谁赢谁输"，是市场在重新定价

DeepSeek V4 不是 AI 竞争的终局，它是催化剂。它把价格拉下来了，把讨论热度拉上来了，逼着大厂不得不加速。

真正的赢家和输家还没定——但有一个趋势已经清晰：AI 开发者的议价能力在上升。你今天掌握的模型路由、推理优化、Agent 编排能力，比任何单一模型的版本号都值钱。

你在用什么模型组合？遇到最大的坑是什么？评论区见。

数据来源：HN DeepSeek V4 (1912分, 1480评论)，Reddit 开源AI讨论，Reddit GPT-5.5 基准测试争议，Reddit AI Agent 安全讨论，Bloomberg Google-Anthropic 投资报道

相关阅读：

DEV Community