大家好,我是听雪,一个渴望提升财商和商业洞察力的终身学习者。
这里是我发布财商学习笔记的第16天。我在这里记录每日的阅读收获与个人思考,旨在梳理逻辑、沉淀认知。欢迎关注与交流,陪你把信息转化为知识,提升商业与财经认知。
近期,DeepSeek寻求融资的消息沸沸扬扬,预估可能会花落阿里或腾讯。我看到有人评论说:“DeepSeek是唯一使用国产GPU的AI公司,其他公司都用的是英伟达。”这句话听起来热血沸腾,但也让我十分好奇:为什么DeepSeek会选择这样的道路?
带着这种好奇,我把CPU、GPU、NPU,以及英伟达、AMD、德州仪器和国产芯片研究了个遍。今天就跟大家分享下我的发现,为什么DeepSeek会全栈押注国产芯片。
首先要澄清一个事实:DeepSeek绝不是唯一一家使用国产芯片的AI公司。各个互联网大厂早就部署了寒武纪、海光、华为昇腾的芯片。
但是,DeepSeek确实是一个特别的存在,因为它是“全栈迁移”。
大部分公司使用国产芯片往往是作为“备胎”,更多是“两条腿走路”:主力模型部署在英伟达的CUDA生态上,国产芯片只是用来做做推理(Inference)或者跑跑小模型。
但DeepSeek V4做了一个惊人的决定:从2025年设计之初,就深度绑定了华为的昇腾(Ascend)系列AI芯片。
DeepSeek V4是首个彻底脱离英伟达CUDA生态,完全基于国产CANN架构进行训练的万亿参数大模型。这就像是你之前一直开法拉利(英伟达),现在不仅换成了国产顶级跑车(华为昇腾),还把引擎调教得比原厂还好。
而且,DeepSeek为了证明自己技术的通用性和降低用户门槛,主动开源并适配了16家以上的国产芯片厂商,包括:华为昇腾、海光信息、寒武纪、沐曦、摩尔线程、天数智芯、壁仞科技……
几乎支持所有的国产GPU,相当“博爱”。
DeepSeek这么做,可以称得上是国产AI芯片生态最坚定的支持者和验证者。它标志着国产AI芯片从“能用”迈向了“好用”和“规模化商用”的新阶段,起到了示范和带动作用,所以就显得很燃、很振奋人心!
刚刚的分享当中有很多概念,比如说英伟达的CUDA、华为昇腾的CANN,还有芯片当中的CPU、GPU、NPU。这些都是什么呢?
CPU(中央处理器):可以理解成计算机的“大脑”,负责处理所有的通用任务。它核心数量少,但是每个核心都非常强大,擅长处理复杂的串行任务。可以把它比喻成一个博学的教授,擅长解决高难度问题,但是每次只能专心处理一两件事情。
GPU(图形处理器):最开始是为了图形渲染设计的,后来发现很适合处理AI运算。可以把它想象成成千上万个小学生,每个人只会做最简单的加减法,但是他们可以同时工作,瞬间完成海量的计算任务。
NPU(神经网络处理单元):就是所谓的“AI专用加速器”。这是专门为AI算法设计的芯片,它的架构模仿人脑的神经元工作方式,在处理AI任务时,效率和能耗都比GPU更高。这就像是一个专才,特别擅长AI算法。
CUDA生态是英伟达早在2006年就推出的一种并行计算平台和编程模型。
如果是GPU是发动机,那CUDA就是变速箱和传动系统。如果没有CUDA,程序员就必须对着发动机写代码,非常困难。但是有了CUDA,程序员只需要踩油门(调用库函数),车就能跑起来。
英伟达就是靠着CUDA这一先发优势,20年积累了海量代码,并且将芯片与CUDA磨合得很好,塑造了自己极高的竞争壁垒。如果公司想要从英伟达迁移到别的芯片,不仅要重写代码,还要重新培训工程师,成本极高。
听着很厉害,那其他的芯片公司难道就没有活路了吗?其实也不是,我梳理了4种突围路径:
1. AMD的策略:做高性价比的“备胎”。主要卖给不想被英伟达垄断的云厂商,比如说微软、Meta。
2. 英特尔的策略:主攻企业级市场。传统的企业(比如银行)本身就用英特尔的CPU,搭载英特尔的AI芯片会更有兼容优势,能耗更低。
3. 云厂商的“叛变”:一些英伟达的大客户为了降低成本、不被卡脖子,开始设计自己的芯片,专门跑自己的AI业务。比如说谷歌的TPU、亚马逊的Trainium、微软的Maia。
4. 德州仪器的“稳稳幸福”:还有像德州仪器(TI)这类公司,他们根本不碰AI芯片,他们奔赴了完全不同的赛道——模拟芯片。在汽车电子、工业控制、电源管理的市场中享受稳稳的幸福。
从外国芯片市场转向国产芯片市场,目前我国芯片市场已形成“一超多强、双轨并行”的竞争格局。
一超是华为海思,提供从提供芯片、服务器到软件架构、云服务的全栈ai解决方案。出货量占据中国ai芯片市场20%的份额,遥遥领先。
多强主要是指寒武纪、海光信息、沐曦股份、摩尔线程、壁仞科技等。
双轨指的是两条核心技术路线:(1)专用AI加速芯片(如NPU):以华为、寒武纪为代表,专为AI计算设计,能效比高;(2)通用图形处理器(GPGPU):以沐曦、摩尔线程等为代表,对标英伟达,兼容性好,通用性强。
尽管发展迅速,但国产ai芯片公司仍面临三大共性挑战:软件生态薄弱,供应链与产能受制于人,高端人才缺失,未来发展依然任重而道远。
DeepSeek“另起炉灶”,深度绑定华为昇腾的CANN架构(对标英伟达的CUDA),是全球最激进的尝试。DeepSeek v4模型即将在4月发布,如果这个模型跑通了,证明了“算法+国产芯片”完全可以绕开CUDA生态,这是对英伟达最大的打击。
DeepSeek创始人梁文峰长期拒绝外部资本,依靠幻方量化的丰厚利润为DeepSeek输血。但现在AI战场变了:算力成本飙升、核心人才流失、生态竞争加剧,他的立场也发生了转变,开始寻求融资。
据说DeepSeek估值约为200亿美元(折合人民币1365亿元),本轮融资6-20亿美元。目前最大的两个候选者是阿里巴巴和腾讯,甚至有消息称阿里与腾讯可能联合投资。
DeepSeek+华为+阿里/腾讯,这似乎蕴含了一种趋势:未来的AI竞争,不单是芯片竞争、算法竞争,而是“芯片+框架+模型+应用”的全栈生态竞争。
英伟达有CUDA,但中国正在通过DeepSeek、华为、阿里、腾讯等企业的合力,构建我们的“第二生态系统”。这不仅是技术的突围,更是数字时代生存权的博弈。而DeepSeek,则是那个吹响冲锋号的先锋。
【重要声明】
本文仅为个人学习笔记,用于记录和梳理公开信息及个人思考。所有内容均不构成任何形式的投资建议或推荐。本人不对任何个人的投资决策负责。市场有风险,入市需谨慎。