一、核心命题:Token经济的范式转移
1. 从"碳基Token"到"硅基Token"
• 过去互联网流量以人类认知带宽为上限(用户发起请求、接收信息均受限于人的算力消耗能力)。
• 未来Agent时代Token消耗主体是硅基智能体,量的天花板被打开。
• 流量特征变化:人访问互联网的"尖峰模式"(上行下行不对称、突发性)→ Agent时代的"高并发持续交互模式"(输入/输出Token体量巨大、上下文Context扁平化)。
2. 从Training到Inference/Agent的地理重构
• Training时代:算力集中(德州等单一超大规模数据中心即可满足)。
• Inference/Agent时代:需贴近用户部署(纽约需求不可能每次都回德州计算),驱动分布式数据中心建设。
• 电力瓶颈叠加:单一地点电力需求爆炸,客观上强制算力地理分散化。
• 【分析】节点数量暴增 + 节点间连接需求质变(以前节点多但无需互联,现在必须互联),这是DCI(数据中心互联)需求跃升的根本结构原因。
二、架构公式重构:从线性到指数
1. 互联网流量公式 vs AI互联网流量公式
• 旧公式:总流量 = 用户数 × 人均流量(受限于人类带宽,线性增长)。
• 新公式:总流量 = 用户数 × Agent任务复杂度 × 多模型调用次数 × 单次任务Token量(乘法关系,指数级增长)。
• 【分析】每个用户背后的实际流量可能是百倍级别增长,而非几倍。
2. 硬件架构的拐点效应
• DCI/光互联前期曲线平坦(小集群内可完成任务,无需外调)。
• 一旦推理爆发、任务复杂度突破阈值,外溢曲线陡峭化(非线性突增)。
• 【分析】当前订单量激增是"拐点后陡峭化"的体现,而非线性渐进。
三、连接(Connectivity)的全局视角
1. 连接是贯穿始终的瓶颈链
• 从GPU↔HBM(先进封装)→ PCB板 → 柜内互联(铜缆)→ 柜间/数据中心互联(光缆)→ DCI(跨数据中心/城市/国家)。
• 每一步都存在"量价齐升":技术迭代 + 总量需求双驱动。
• 【分析】PCB板本质也是"连接服务"(电信号传输),铜箔光滑度已成为物理瓶颈(日本厂商技术积累)。
2. DCI的定位跃迁
• 过去:外围环节,优先级靠后(Scale-up优先于Scale-out,DCI在Scale-out之外)。
• 现在:从"可选项"变为"必选项",流量性质、节点数、连接属性三重变化叠加。
四、投资大方向:Adoption Gap与轮动节奏
1. 当前阶段定位(AI Capability vs AI Adoption)
• AI Capability曲线:2023年暴增,已处于高位(模型能力已验证)。
• AI Adoption曲线:极度平缓,社会使用处于极早期。
• 【分析】投资核心矛盾不再是"AI有没有能力",而是"如何让全社会把AI用起来"。
2. 两类受益方向
• 应用捕获层:能抓住Adoption机会的公司(如Cursor、Copilot等获得大量订阅)。
• 基础设施推动层:通过存储、连接、算力等让"所有人能够大量使用AI"的厂商。
3. 收入-资本开支Gap的弥合逻辑
• 2024年:纯Chatbot模式,天花板接近搜索/广告,Capex几千亿 vs 收入极少,Gap离谱(约6倍)。
• 2025年:Agent模式开启(Coding场景突破),潜在市场从"码农市场"扩展到"所有知识工作者",TAM打开至10万亿美金级别(3万亿程序员工资+7.8万亿软件市场+白领费用)。
• 【分析】Coding场景是信念转现实的节点:去年9-10月工程师普遍>50%代码由AI生成;今年初非技术人员也能通过自然语言让Agent完成任务。
• 预期:若年底AI应用Run Rate达2000-3000亿美金,Capex 1万亿,Gap缩小至3-4倍,逻辑上可接受。
五、类比框架:AI革命更像电力/石油,而非互联网
维度 互联网革命 电力/石油革命 AI革命
替代对象 信息连接效率 人类体力劳动(肌肉) 人类认知劳动(大脑)
增长模式 网络效应,四两拨千斤 消耗型,持续基建投入 消耗型,Token即消耗
价值捕获 收税模式(广告/平台抽成) 生产力替代,捕获全部增量 生产力替代,捕获全部增量
伟大公司体量 万亿美元级(轻资产网络效应) 数千亿级(重资产消耗型) 【前瞻】可能超越两者,因Token支出占收入比例远高于当年油电支出
持续性 拉网线结束即结束 需持续建厂、烧电、维护 需持续建算力、烧电、迭代
• 【分析】互联网是"连接价值"(take rate),AI是"生产力价值"(total capture),长期价值创造量级可能大一个台阶。
• 历史参照:1950年后,人和动物产生的动能占全球比例降至<<5%;类比未来,人类大脑直接提供的认知服务占比可能同样降至极低,由AI接管。
六、基础设施迭代逻辑:不是"缺货炒作",是"标准持续升级"
1. 核心区别
• 旧思维:缺钢筋水泥 → 造出来 → 结束。
• AI Infra:能力需求持续提高 → 每代标准升级(H→B→Rubin→Rubin Ultra→Feynman)→ 配套连接/存储/供电持续升级。
2. 系统级摩尔定律
• 以"每GW处理Token能力"为指标,约每1-2年翻倍(类似芯片摩尔定律,但扩展至系统级)。
• 算力很贵 → 系统其他短板必须补齐(存储瓶颈→补存储;连接瓶颈→补连接;供电瓶颈→补供电)。
3. 高压化趋势(功率=电流×电压)
• Rack功率:GB系列100kW → Rubin 200kW → Rubin Ultra 500-600kW → Feynman继续提升。
• 功率暴涨+电压不变=电流暴涨→传输损耗剧增→铜缆承载力不足→高压化路径。
• 衍生变革:输电侧层级变化、每层电压转换幅度变化→功率半导体要求提高→芯片供电架构从传统模式转向新架构→新玩家机会。
七、Capex轮动与"老登复兴"
1. Capex结构轮动
• 第一阶段:算力占绝对主导(NVDA率先受益)。
• 第二阶段:存储瓶颈暴露,存储占比提升(HBM/DRAM厂商受益明显)。
• 第三阶段:连接、电源等"老登"环节瓶颈暴露,但起点基数小(DCI去年几十亿→今年几百亿订单,占1万亿Capex仅1-2%)。
• 【分析】老登业务当前占公司收入10-20%,但面临10倍行业空间×占比提升的双重弹性,逻辑是"估值修复→业绩拉动→利润率提升"的戴维斯双击。
2. "老登守卫世界" vs "上一轮小登泡沫"
• 互联网泡沫:参与者全是小登(Cisco、微软早期等),无Consumption Base逻辑,拉网线结束即见顶,易集体上头。
• AI时代:守卫者全是老登(台积电、日本/韩国材料厂、台湾封测、美国光通信老牌厂商),扩产保守+中国被隔离在外(新设备获取障碍)→ 供给侧纪律性强。
• 【分析】老登年纪大、决策慢、扩产慢,反而构成供给侧壁垒;叠加Consumption Base(持续消耗),周期持续性远强于互联网泡沫。
八、中国"小登"的机会与风险
1. 机会来源
• 夹缝产能:老登产能不足被迫外溢(如中际旭创/新易盛在光模块的崛起)。
• 非Critical环节进入:连接、电源等领域对"非美"供应商容忍度较高。
• 国内市场独立循环:大模型/应用层类似互联网时代的"中国版"路径。
2. 风险来源
• 技术路径替代风险:连接行业多路径并存,需筛除"被整体替代"的高风险环节。
• 台积电Moment的反面:某些环节一旦进入"台积电Moment"(壁垒固化、玩家减少),后来者难以突破;但尚未固化的环节仍有窗口期。
• 【分析】需Close Watch中国小登"卷进来"的时间点和环节,竞争演化是核心变量。
九、具体瓶颈环节清单
环节 当前状态 关键卡点
先进封装 高壁垒,台积电Moment已现 设备投入重(20+台机器/产线),大客户需4-5条产线
PCB/铜箔 物理瓶颈显现 铜箔表面粗糙度影响电传输效率,需极致平滑(日本厂商积累)
光互联/DCI 拐点陡峭化初期 节点数+带宽双暴增,从Scale-out外围进入核心
存储 瓶颈已验证 HBM/DRAM在Capex中占比已显著提升
供电/功率半导体 高压化变革前夜 Rack功率暴涨→高压化→电压转换层级变革→供电架构重塑
CPU/异构计算 持续迭代 配合GPU代际升级,标准不停提高