成本拐点,比预期来得更快
2025年初DeepSeek R1横空出世,打破了「大模型必须烧钱」的叙事。一年多过去,市场还没完全消化那轮冲击,R2的传闻又开始在行业内流传。这不是偶然的节奏——中国大模型的迭代周期正在压缩,每一轮都在重估企业AI的落地成本。
目前流传的技术参数显示,DeepSeek R2推理效率较R1提升约3倍[1],API单价降至R1的60%[2]。这两个数字叠加,意味着企业调用同等AI能力的实际成本将压缩至此前的20%左右。这不是渐进式改善,而是量级变化。
应用层:被压抑的需求正在释放
成本曲线向下,需求曲线向上,这是应用层的基本逻辑。2026年Q1,国内AI应用DAU增速环比已达+35%[3],这一数字出现在大规模商用之前,说明市场的弹性远比预期大。
受益最直接的是那些以API调用为核心成本结构的公司。科大讯飞的星火大模型在教育和政务场景深度绑定,推理成本每降一档,其企业服务的毛利率就改善一档;智谱AI的GLM系列走的是开放API路线,低价策略在成本进一步压缩后会有更大的商业化空间。
港股互联网的逻辑略有不同。腾讯混元、百度文心不是靠卖API赚钱,而是把AI能力嵌进广告、搜索、游戏等现有业务。成本下降对它们的直接意义是:可以用更低的边际成本把AI功能铺向更广泛的用户群,形成规模效应。百度在AI搜索上的投入已经在营收结构里有所体现,若推理成本继续下行,这部分业务的盈亏平衡点将明显前移。
算力层:溢价逻辑开始松动
算力是这轮分化里最值得关注的承压方向。过去两年,GPU稀缺叙事撑起了云算力的高溢价,租赁价格居高不下。但推理效率提升3倍意味着,同样一块GPU现在能服务的请求量增加了3倍,供需格局实质性宽松。
行业测算显示,云算力租赁价格预计下行10-20%[4]。这个区间不算灾难性,但足以影响相关厂商的定价权预期。更深层的影响在于训练侧:如果高效小模型能以更低参数量实现同等效果,客户对顶级训练卡的付费意愿会边际下降,英伟达H100/H200在中国市场的替代品需求逻辑也会受到挑战。
我的观察是,算力股的压力不是线性的。短期内存量合同和数据中心建设惯性会缓冲冲击,但12-18个月维度,若R2的效率数据得到验证,云厂商AI训练加速卡的租赁续约价格谈判将明显处于劣势。
结构性分化:应用层 vs 算力层
| 维度 | 受益方向 | 承压方向 |
|---|---|---|
| 成本结构 | AI应用层(API调用方) | 云算力租赁(算力供给方) |
| 代表标的 | 科大讯飞、智谱、腾讯、百度 | GPU云服务商、AI训练卡厂商 |
| 核心逻辑 | 推理成本下降→毛利率改善→商业化加速 | 供需宽松→定价权弱化→租赁价下行 |
| 时间维度 | 中短期即可反映 | 12-18个月逐步传导 |
需要留意的不确定性
DeepSeek R2目前仍是传闻阶段,技术参数未经官方确认。历史上不乏模型发布前的参数泡沫——R1发布时市场的预期也一度超出实际表现,最终数据落地才定价。
- 若R2效率提升幅度低于传闻(如仅提升1.5x而非3x),应用层的边际改善将打折,市场情绪可能反转。
- 监管对AI应用的内容审查和数据合规要求,可能延缓部分高增速场景的商业化节奏。
- 云算力的下行压力存在滞后性,短期内已签合同的锁价结构会缓冲冲击,不宜线性外推。
每一轮大模型效率跃升,最终都会在应用层找到出口。2016年AlphaGo之后,棋牌AI应用爆发;2022年GPT-4之后,代码助手市场重估。这次的不同在于,主角是中国本土模型,应用层的受益是本土公司,而不是将溢价输送给海外算力巨头。
小结
DeepSeek R2传闻的核心信号是:企业AI的成本拐点比市场预期更快到来。推理效率提升3倍、API降价40%,将加速AI在教育、政务、金融、内容等垂直场景的规模落地。受益方集中在应用层——尤其是API调用成本敏感型的中国AI公司;承压方集中在算力层——云算力租赁溢价和GPU训练卡的定价权逻辑正在弱化。结构性分化已经开始,方向比时点更重要。
数据来源
- DeepSeek R2推理效率数据:行业传闻,未经官方正式发布确认,仅供参考。
- DeepSeek API定价:DeepSeek官方平台公开定价信息(platform.deepseek.com)。
- 国内AI应用DAU增速+35%(2026Q1):艾瑞咨询《2026年Q1中国AI应用市场报告》。
- 云算力租赁价格预计下行10-20%:中金公司《AI算力行业2026年中期展望》研究报告。
本文仅供参考,不构成投资建议。
常见问题
这篇文章属于 m8 的哪个研究入口?
这篇文章归入 AI产业链 主线,建议先从 AI产业链栏目 进入,再结合研究目录里的相邻专题一起看。
读完这篇后,下一步应该看什么?
优先继续看 AI产业链文章列表、AI产业链研究中心、GPU / 算力平台。这些入口能把单篇内容放回市场、行业和方法论框架里。
后续最需要跟踪哪些变量?
后续重点跟踪:AI capex、GPU/HBM/先进封装供给、服务器交付、软件变现和产业链利润分配是否兑现。
这篇内容可以直接当作投资建议吗?
不可以。m8 的文章用于整理公开信息、研究框架和风险变量,不构成个股买卖建议,也不替代个人的仓位管理和风险评估。
m8 会如何更新这类主题?
如果后续出现财报、政策、订单、资金流或估值假设的关键变化,m8 会在对应栏目和专题页继续补充更新,并通过内链把新旧文章串起来。