DeepSeek打破了闭源寡头垄断的局面,此前超大模型占主流,巨大的投资和持续的scalinglaw是门槛,现在有了DeepSeek-V3/R1(有很多蒸馏小模型),很多企业会加大自研大模型和私有化部署。
对美国AI大模型大厂的影响,竞争对手OpenAI、META开始加大卷RL强化学习,直接对标DeepSeek出产品。对于中国的AI大模型公司和互联网公司,逻辑上应该得到中国AI资产重估的机会,DeepSeek反映了中国AI大模型在技术创新、推理应用方面相比于美国公司被明显低估。
DeepSeek的出现,最利好推理应用的推进,这一点几乎没有争议。DeepSeek的目标就是大幅降低推理算力成本,开源方式,加快AI大模型技术的应用爆发。大模型变得更小、更好用、更便宜,对应用无疑是全方位的利好。利好端侧的各式智能硬件(眼镜、手机等)、端侧AIOT芯片,电脑、手机上可以丝滑部署蒸馏后的DeepSeek小模型。对于汽车智驾、机器人等AI端侧应用,逻辑上是利好的。拥有完整生态的品牌厂商能更好地满足消费者对智能产品的需求,进一步扩大其市场份额。
模型成本下降,质量提升,有望加速带有任务规划属性Agent类应用加速发展。DeepSeek带来AI技术平权,对于应用二三线公司是利好。模型侧的加速变化,最直接的变化,会带动Agent厂商快速迭代产品,关注国内软件公司在Agent方面的进展,特别是国内互联网大厂Agent能力更强,产业链公司跟着受益。
DeepSeek出来之后,市场对算力投资存在分歧,DeepSeek提供了低成本进行大模型训练、推理的思路,可能引发其他模型厂商的效仿。市场会按照“短空长多”去理解算力,结构性还会分化,“短空”是指海外大厂AI资本开支放缓风险加大,“长多”是指低成本模型推动应用推理需求的爆发,结构性分化是指,训练算力放缓,推理算力起量。短期对投资信心和情绪可能有压制,拉长看算力还是受益AI推理应用爆发。
算力产业链美国会加大制裁、推动GPU国产化的加快,DeepSeek已经引来了美国上上下下的高度关注和敌视态度。国产GPU还有一大利好来自DeepSeek,对于万卡互联的需求没有特别高,把工程问题前置,这降低了使用国产GPU的门槛。芯片制造在逻辑上最受益、竞争格局最好。