AI产业正在同时经历两条主线的变化:一条发生在模型厂商的商业模式端,另一条发生在光互联硬件产业链端。前者的核心是智能体工作负载带来的token成本压力,后者的核心是NPO与CPO路线在2027至2028年的同步推进。
这两条主线看似分散,实际存在同一个底层逻辑:AI应用越走向智能体化,token消耗和算力需求就越高;模型厂商必须重新定价、重新配置算力容量;而只要AI应用需求持续,硬件采购周期就不会停止,光模块、NPO、CPO、保偏光纤、FAU、CW光源、硅光芯片等环节都会继续被推到产业链前台。
因此,这份材料的重点不是单纯讨论某一家模型公司涨价,也不是单纯讨论NPO替代CPO,而是把AI模型商业模式、算力成本、IPO前财务调整和光互联供应链放在一起看。只有模型厂商的经营逻辑能够闭环,硬件产业链的长期订单基础才会更稳。
01|智能体工作负载击穿包月订阅,Anthropic转向按token计费

Anthropic调整定价模式的核心原因,是token消耗量过大,原有包月订阅模式被结构性击穿。过去的包月模式,本质上建立在“用户注意力有限”的前提上:用户每天使用时间有限,哪怕订阅后可以较自由地使用,整体消耗仍然受人类交互频率约束。
智能体改变了这个前提。自主智能体的token消耗量可以达到人工交互的20倍到100倍,而且可以24小时不间断运行。用户不再是一次次手动提问,而是让模型作为底层基座持续执行任务、写代码、运行工具和完成工作流。
在这种情况下,包月模式就会变成对重度用户的补贴。重度程序员、智能体开发者和自动化工作流用户,只要支付固定月费,就可以消耗远超普通用户的算力资源。但对模型厂商来说,GPU仍在运行,推理成本照常发生,成本压力不会因为用户支付的是包月费而消失。
所以Anthropic取消包月、转向按token使用量收费,不只是一次价格调整,而是一次商业模式修正。它要解决的不是“多收一点钱”,而是把无限制消耗的低价值负载重新定价,让算力资源从无差别补贴转向更精确的容量配置。
02|包月模式本质是对重度用户补贴,算力成本无法长期覆盖
包月模式对轻度用户和重度用户的经济意义完全不同。轻度用户只是偶尔问几个问题,实际消耗很低,包月费用可能远高于其实际成本;重度用户则会通过智能体、代码工具和自动化任务大量消耗token,实际使用成本往往超过月费。
这就形成了交叉补贴:轻度用户补贴重度用户,厂商承担超额算力成本。只要重度用户占比不高,这种模式还能维持;但一旦智能体成为主流使用形态,重度负载比例快速上升,包月模式就会被击穿。
对模型厂商来说,token服务不是虚拟商品。每一次推理背后都是GPU、数据中心、电力、网络和运维成本。智能体可以连续调用模型,等于让原本受人类注意力限制的需求,变成近似持续运行的机器需求。
因此,Anthropic调整定价的本质,是停止用固定订阅费覆盖不可控的边际算力消耗。重度用户必须为其真实消耗付费,否则厂商的毛利率和经营现金流都会被持续压缩。
03|Anthropic终止补贴,赌核心用户不会因涨价流失
Anthropic在自己最强的产品上终止补贴,反映的是一种产品自信。Claude Code是Anthropic最成功的应用,也是这次定价调整的核心主角。它在程序员和智能体工作流中具备较强用户粘性,因此公司敢于赌核心用户不会因为价格上涨而大规模流失。
这种策略的风险也很明确:一定会有部分用户流失,尤其是价格敏感型用户和轻度替代型用户。但如果核心开发者、企业用户和高价值工作流用户愿意继续付费,Anthropic的收入质量会显著改善。
包月取消后,重度用户支付更多费用,会直接提升财务表现。短期用户结构不会立刻发生剧烈变化,因此定价调整往往能较快反映在收入和毛利改善上。对准备融资或上市的公司来说,这种改善尤其重要。
更关键的是,用户对涨价是否敏感,本身就是产品价值的验证。如果用户流失率低,说明产品具备真实刚需和定价权;如果流失率高,则说明原有增长更多依赖补贴。Anthropic这一步,本质上是在让资本市场验证其产品竞争力。
04|OpenAI维持包月补贴,是市场份额和ARR增长的防守策略
OpenAI在Anthropic调整后选择反向操作,维持原有包月模式,以此吸引Anthropic用户。这是战略层面的博弈,而不是简单的价格促销。
OpenAI当前在C端用户规模上明显领先,但在B端开发者和部分编程智能体场景中,仍然面临Anthropic追赶。维持包月补贴,可以降低用户迁移成本,用更低表观价格争夺重度用户和开发者工作流。
这种策略之所以可行,与OpenAI重新调整成本结构有关。OpenAI与微软重新谈判合作协议,降低了营收分成压力,同时终止排他性云合作,使其可以向更多厂商采购算力资源。算力获取灵活性提升后,OpenAI为智能体用户提供补贴所承受的边际压力有所下降。
因此,OpenAI维持包月,不是因为包月模式天然健康,而是在当前追赶和上市前窗口期,用市场份额换取ARR增长。它走的是防守型路线:先扩大用户和收入规模,再通过成本结构调整缓解亏损压力。
05|两家公司定价分歧,本质是产品地位、算力约束和IPO节奏差异
Anthropic和OpenAI在定价策略上的分歧,不能只从价格本身解释。两家公司所处的位置不同,产品优势不同,算力成本结构不同,IPO前的财务诉求也不同。
Anthropic在Claude Code上具备较强优势,因此选择在强势产品上终止补贴,改善收入质量。OpenAI则在重新调整成本结构后,继续维持agentic补贴,用包月模式吸引用户、扩大市场份额,并推动年化经常性收入增长。
算力约束让计费模式不再只是收入决策,而变成算力容量配置决策。Anthropic面对高昂数据中心租赁和算力成本,必须把算力从低价值、无限制负载中释放出来;OpenAI则通过调整微软合作关系和扩大算力采购渠道,争取到更灵活的补贴空间。
两家公司都在IPO前清理财务结构,但方向不同。Anthropic清理的是收入质量端,减少低价值补贴;OpenAI清理的是成本端和负债端,降低路演时的财务压力。这种分歧,反映了两家公司对“当前最重要问题”的判断完全不同。
06|算力租赁成本上升,让计费模式变成容量配置决策
Anthropic面临的最大压力之一,是算力租赁成本。材料中提到,Anthropic与相关企业签署了机房租用协议,合同期限三年,总金额达到400亿至450亿美元;谷歌也签署了类似租用协议,两笔合同的年化租金合计约260亿美元。
这类数据直接体现了AI模型厂商成本结构的变化。随着模型能力提升和智能体使用增长,算力不再只是研发投入,而是持续经营成本。每一个低价值重度用户占用的算力,都可能挤占更高价值用户或企业客户的服务能力。
在这种背景下,原有包月模式的经济问题更加明显。24小时运行智能体的重度用户,消耗的是最昂贵、最稀缺的推理资源。如果这些用户仍按固定低价付费,就会造成算力资源错配。
因此,Anthropic调整计费模式,实质是在重新分配算力容量。它把一部分边际价值较低的使用需求重新定价,从而让稀缺算力流向更高付费能力、更高商业价值的工作负载。
07|中国模型成本优势明显,海外厂商卷价格并非出路

如果海外模型厂商试图通过价格战解决竞争问题,会面临中国模型的降本压力。中国模型的研发方向高度围绕降本展开,每一次架构优化、推理优化和模型更新,本质上都在提升单位算力效率、降低运行成本。
材料中列举了一组工作负载成本对比:Claude Code运行相同评测工作负载的总成本约为4800美元,ChatGPT为3000多美元,Claude为1000美元,KIMI为900多美元,智谱大模型仅为500多美元。按这个口径,Anthropic方案成本可能是最便宜中国替代方案的约9倍。
这说明海外厂商如果单纯卷价格,很难长期占优。中国模型虽然在全球高端开发者生态中的份额仍有不确定性,但在成本敏感型工作流、低需求任务和多模型路由场景中,具备很强替代潜力。
智能体工作流本身也天然适合多模型路由:高难度任务使用能力更强、价格更高的模型;低难度任务使用成本更低的模型。随着智能体平台成熟,模型选择会越来越成本导向,而不是个人用户那种单一偏好导向。
08|AI模型厂商经营健康度,决定硬件采购周期的稳定性
讨论Anthropic和OpenAI的定价策略,并不是偏离硬件产业链,而是因为模型厂商的经营健康度直接影响长期硬件需求。只有这些大模型厂商能够顺利把成本传导给终端用户,才能持续采购GPU、网络设备、光模块、PCB、电源和数据中心基础设施。
如果模型厂商长期无法盈利,短期可能仍会继续采购硬件,因为AI竞争具有明显博弈属性。但一旦经营压力加剧,融资环境变化或资本市场重新定价,硬件产业链会率先感受到需求波动。
因此,AI硬件产业链不能只看技术升级和订单增长,还要看最终使用方能否形成健康商业闭环。模型厂商如果能够通过涨价、按量计费、多层级定价和成本优化实现现金流改善,硬件需求的持续性会更强。
换句话说,Anthropic的按token计费与OpenAI的包月补贴之争,最终会传导到算力采购节奏。模型商业模式越健康,数据中心扩建和光互联升级的确定性越高。
09|英伟达扶正NPO,2027至2028年或与CPO同步落地

在光互联路线方面,材料强调NPO的重要性正在提升。谷歌、亚马逊将相关方案作为主流过渡技术,芯片与光引擎解耦封装已成为行业共识。英伟达也将NPO扶正,2027至2028年NPO和CPO两大路线可能同步落地。
NPO与CPO最大的差异之一在运维。NPO支持现场插拔更换,只需要停机并配合专业工具即可完成操作;CPO的光引擎则是固化集成结构,无法现场处理,必须送回原厂维修,维修周期可能长达3至4个月。
这一差异对数据中心很关键。大规模AI集群要求高可用性和快速维护,如果某个互联模块故障就需要长周期返厂,运维压力会非常大。NPO的可维护性,使其在过渡阶段甚至部分主流场景中具备明显吸引力。
因此,NPO不是CPO的简单替代品,而是以更低工程化难度、更强可维护性和更快导入能力,成为高带宽互联升级中的现实选择。
10|NPO出货量预测仍属市场猜测,当前不宜过度量化
市场上存在大量关于NPO出货量的预测,例如英伟达2027年NPO采购量达到1000万只,或某些方案中NPO需求达到更高规模。但材料明确指出,这些数据并未得到官方确认,仅为行业预估,不是正式订单,也不是官方业绩指引。
现阶段NPO相关产品仍处于研发测试阶段,性能、可靠性、灰度等测试尚未全部完成。无论是英伟达、谷歌、旭创,还是供应链上下游传出的出货数据,都更接近市场猜想,不宜直接用于严肃量化测算。
这并不意味着NPO方向不重要,而是意味着产业跟踪要区分“技术方向明确”和“出货规模确定”。方向上,NPO在2027至2028年具备较高关注价值;数量上,当前所有千万级预测都应保留折扣。
对投资和产业分析来说,现阶段更应该把握技术路线、客户验证、供应格局和成本结构,而不是过早把未经确认的出货数字当成财务模型基础。
11|双柜NVL144可能成为主力方案,并放缓CPO替代进程
材料中提到,不同服务器机柜方案对应的NPO配置差异很大。部分高端方案设想为机柜之间部署CPO,单卡搭载4个3.2T NPO,机柜内部通过铜缆互联。这类方案综合成本最高,但性能表现也最强。
不过,高端方案整体占比并不高。目前更可能成为出货主力的是双柜NVL144方案。该方案依靠NPO直连组网,机柜之间借助NPO完成互联,无需搭配CPO,性价比更均衡,作用类似当前NVL72产品。
如果双柜NVL144成为主力,它会放缓行业内CPO的替代进程。原因很简单:只要NPO直连方案能够满足性能和成本要求,数据中心就没有必要在所有场景中快速切换到更复杂、更难维护的CPO。
单柜144版本虽然单GPU搭配NPO数量最多,但受限于散热和高压供电技术尚未成熟,落地概率较低,量产可能延期。因此,NPO内部也存在不同方案分化,不能把所有需求都简单合并。
12|海外CSP需求空间大,但两年总量与单年采购要区分
海外头部云厂商在2027至2028年的NPO采购规模可能较大。材料中提到,谷歌、亚马逊两家两年合计需求均为1200万只。但这里需要特别注意:这是两年总需求量,不是单年采购量。
千万级需求总量通常是结合芯片产品生命周期测算得出。例如Trainium4产品从出货节点、供货周期和两年以上生命周期分摊计算,可能形成较大的总需求。但初期采购量和后续追加订单需要分开看。
材料中也提到,国内阿里、腾讯、字节跳动均已规划相关采购,2027年国内整体需求可能在200万至300万只。但这些数字同样需要结合测试、客户导入、量产良率和方案最终确认来观察。
因此,NPO需求方向明确,但量化不能过度亢奋。当前最重要的是判断哪些客户会真正导入、导入哪种方案、单机柜配置多少颗NPO,以及生命周期如何分摊。
13|NPO供应格局偏集中,旭创、新易盛、Coherent占据核心位置
NPO整机供应商格局已经相对明朗,行业集中度偏高。材料中提到,旭创综合实力领先,拿下tower产能,全球市占率约50%,并且与海外头部云厂商合作优势显著。
新易盛深度绑定亚马逊供应链,全球市占率约25%。天孚通信主要为英伟达供货,整体市占率不足10%。Coherent作为可提供一站式配套服务的厂商,市占率约15%。
这意味着NPO并不是一个容易弯道超车的新赛道。虽然产品形态在变化,但客户认证、硅光能力、交付能力、FAU配套、光源资源和系统整合能力仍掌握在头部厂商手中。
对产业链来说,NPO放量会强化头部厂商优势。新产品迭代通常带来更高毛利率和新增价值量,但这些红利大概率先由具备完整供应能力和客户绑定的头部企业获取。
14|3.2T NPO毛利率高于传统光模块,但替代效应同样明确
NPO产品的毛利率整体高于传统光模块。材料中提到,3.2T NPO产品伴随量产推进,价格可能从1200美元下调至1000美元,量产后综合毛利率预计可达50%至60%。目前产品尚未量产,该数据仅为市场预估,但方向上反映了新产品迭代的毛利红利。
3.2T NPO核心成本构成包括硅光芯片、电芯片、FAU、基板及各类辅料。若企业能够自研硅光芯片,就可以大幅压缩整体成本,省去外部设计环节的利润空间。
但NPO的需求并非完全凭空新增。本质上,它会替代一部分传统光模块和AOC需求。机柜之间原本就需要光模块或AOC完成互联,NPO只是以新的产品形态承接这些互联需求。
因此,NPO既是机会也是挑战。机会在于未来两到三年可能带来大量周期性订单和更高毛利;挑战在于它会改变传统光模块需求结构,使行业价值向头部整机和关键组件厂商集中。
15|FAU向dFAU迭代,组件价值较传统产品提升明显

FAU是光互联核心组件之一。材料中提到,产品正在向可插拔dFAU迭代,CPO新一代产品已经标配dFAU,组件价值相较传统产品提升十倍,天孚相关业务毛利率超过60%。
dFAU的价值提升,来自产品形态和应用场景变化。随着NPO、CPO等高端互联方案推进,光纤阵列、耦合精度、可靠性和可维护性要求都在提升,低端FAU无法满足高端产品需求。
行业FAU供应商分工也较清晰。天孚全球份额领先,台企上诠专攻CPO配套FAU,但NPO渗透率偏低;头部光模块企业在样品阶段可能自研FAU,规模化生产后则会通过外包工序降本。
此外,Senko布局dFAU进度相对滞后,光库通信则依托保偏FAU切入头部供应链。FAU环节的核心看点,是产品升级带来的价值量提升,以及头部客户认证后的份额稳定性。
16|硅光衬底整体供需平衡,短期涨价不宜当成突发紧缺
NPO所用硅光芯片面积远超传统光模块,会拉高大硅片需求。材料中提到,海外Soitec、信越化学垄断超八成市场份额,国内沪硅产业获得Soitec技术授权,储备产能较充足,未来有望拿下一定市场份额。
但从全球范围看,硅光衬底整体供需仍处于相对平衡状态,并未出现极度紧缺。短期价格上涨已经持续一段时间,并非突发变化,不宜当成新动向盲目跟进。
Soitec在该领域技术全球领先,手握大量核心专利,技术壁垒较高。国内厂商获得技术授权是重要进展,但不是突然出现的新消息,后续仍要观察客户验证、产能利用率和真实份额提升。
因此,硅光衬底的逻辑不是短期抢货,而是长期国产份额提升和高端硅光需求增长。它是NPO/CPO产业链中的基础材料环节,但短期供需弹性需要理性看待。
17|保偏光纤是NPO刚需,长飞产能领先
保偏光纤是NPO刚需配件。材料中提到,2027年全球配套市场规模接近1亿美元。随着NPO在头部CSP和英伟达体系中的导入,保偏光纤需求会随之提升。
供应格局方面,长飞光纤全球产能领先。康宁过半产能计划外包代工,日系及国内其他光纤厂商产能规模有限。这意味着保偏光纤环节具备较高集中度,头部厂商更容易受益。
保偏光纤的价值在于维持光信号偏振状态,满足高端光互联系统的稳定性要求。随着NPO、CPO、外置光源等方案推进,对光纤连接可靠性和一致性的要求会更高。
因此,保偏光纤不是普通光纤的简单延伸,而是高端光互联中的关键配套。其市场规模未必巨大,但在NPO供应链中属于确定性较强的刚需环节。
18|大功率CW光源升级,磷化铟衬底成为远期瓶颈
大功率CW光源规格正在持续升级。海外多家企业布局高功率产品研发,英伟达指定Lumentum为核心供货厂商。国内光源厂商预计在2027年下半年逐步切入供应链,长期有望拿下过半份额。
光源功率升级会带来上游材料压力。作为光源核心基材,磷化铟衬底在产品功率升高后,产出量和良率都会明显下滑。大功率产品产能效率较低,远期供需缺口可能持续扩大。
材料中还提到,旭创当前CW光源主要由源杰科技供货,但已经开始对接新的供应商。新供应商后续有望开启海外送样,但周期较长,从送样到落地至少需要一年。
这说明CW光源链条短期仍以既有供应商为主,新增供应商切入需要时间。长期看,大功率CW光源、磷化铟衬底和海外客户验证,会成为光源国产替代的核心变量。
19|铜箔供给仍紧张,但上游周期属性需要警惕
材料开头还提到铜箔供给紧张。铜箔目前确实处于紧张状态,并且这种紧张可能持续两三年。但需要注意,铜箔属于偏上游品类,上游品类周期性更强。
涨价确实存在,最近也出现了大幅上涨。但越偏上游的品类,越容易在价格上涨后刺激产能释放。对于这类可以相对较快扩产的品类,即便一年周期,也应该视为短期供给变化窗口。
光模块也有周期属性,但其抗周期能力和综合属性更强一些。相比之下,上游材料的价格波动往往更剧烈,投资和产业跟踪都不能只看当前紧缺,还要关注新增产能、扩产速度和下游真实需求。
因此,铜箔的逻辑是短期紧缺与周期风险并存。供需紧张可以支撑涨价,但一旦产能释放快于预期,价格弹性和盈利弹性都可能快速变化。
20|产业判断:AI商业模式修正与光互联升级会相互强化

这份材料最重要的启发,是AI商业模式和硬件产业链不能割裂看。Anthropic调整定价模式,表面是token收费问题,实质是智能体负载、算力容量和收入质量问题;NPO和CPO路线之争,表面是光模块形态问题,实质是数据中心在更高带宽、更低功耗、更强可维护性之间重新选择。
如果模型厂商能够把智能体成本顺利传导给用户,AI应用商业闭环会更健康,硬件采购周期也会更稳定。反过来,如果包月补贴长期无法覆盖成本,模型厂商经营压力会传导到数据中心扩建和硬件采购节奏。
光互联方向上,NPO正在成为2027至2028年最重要的增量变量之一。它具备更好的现场维护能力,更容易在头部CSP和过渡方案中导入;CPO仍是长期先进方向,但工程化复杂度和运维难度决定了其放量节奏不会一蹴而就。
最终,AI产业链下一阶段的核心不是单点概念,而是成本、良率、维护、交付和商业闭环。模型厂商要解决token经济学,硬件厂商要解决量产工程学。谁能同时跨过这两道门槛,谁才能在AI长期周期中获得真正可持续的价值。