光模块与算力硬件前瞻:CPO落地节奏与上游材料博弈

当前 AI 算力产业链的基本面和主要矛盾并未发生实质性变化,但随着技术迭代的深入,市场对各类技术方案的落地节奏和真实需求产生了较大的预期差。本文将围绕 CPO/NPO、光模块、PCB 覆铜板及上游磷化铟衬底四大核心赛道进行深度拆解。

一、 CPO与NPO:技术路线并跑,警惕“虚假出货量”

目前行业对 CPO(光电共封装)的预期逐渐同步,但需要明确的是:CPO 业务要对相关企业产生实质性的财报利润贡献,大概率要等到 2028 年

  • 真实需求测算:近期市场传言英伟达明年 CPO 出货量达 20 万台,这严重脱离产业实际。基于乐观假设(1000万片芯片中有 576 万片用于 576 端口的高规格节点机柜),整体 CPO 需求也仅在 4 万台左右。现阶段出货量的高低并不反映技术竞争力,核心在于技术方案的成熟度。
  • 产业链价值拆分:在 CPO 架构中,光引擎占比 60%-70%(由台积电主导硅光集成),交换芯片占 15%-20%,外部光源占 10%-15%(Lumentum 主导),光路连接占 3%-5%(天孚通信等主导)。
  • 英伟达路线图:英伟达不仅在推进 CPO,也在同步研发 NPO(近封装光学)。旭创(Zhongji Innolight)在 NPO 方案的提出、实施以及后续的光模块制造环节中处于行业领跑位置。即将到来的 GTC 大会上,英伟达大概率会展示正交背板方案与 LPU,但这属于行业公开的“明牌”,较难产生超预期的情绪催化。

二、 光模块格局:剑桥科技 800G 取得关键突破

在传统光模块赛道,新玩家的交付进度是市场关注的焦点。

  • 剑桥科技(CIG):已顺利通过 Meta 的 800G 光模块批量灰度测试。相比于挑选少数样品的测试,批量灰度测试的通过具有极高的产业含金量。预计 4 月份将进入量产阶段,全年有望切入 Meta 百万只级别的采购盘子。
  • 1.6T 进展:剑桥的 1.6T 目前仍在测试中,短期难以贡献实质业绩。但对赛道新玩家而言,能稳固 800G 的正常供货已是重大的产业里程碑。

三、 PCB 与覆铜板(CCL):上游涨价实为“利空”

伴随 LPU 及 CPX 等专用算力机柜的推出,市场对多高层 PCB 寄予厚望。但需注意两大逻辑误区:

  1. 增量规模有限:LPU 专为低时延推理(如实时语音、代码生成)设计,属于“偏锋路线”,在通用算力机柜中的市场占比有限,对 PCB 的实际拉动规模需打折扣。深南电路与沪电股份依然是该领域的核心双雄。
  2. 覆铜板的“涨价伪逻辑”:近期铜价上涨带动生益科技等 CCL 厂商产品涨价,这在产业端完全是利空。因为上游原材料涨价是硬性的,而 CCL 企业向下游 PCB 传导价格存在 1 个月左右的滞后期。这段时间差会让企业承担巨大的成本损耗,因此涨价并不能提升其盈利能力。

四、 磷化铟(InP)衬底:出口管制下的库存博弈

磷化铟是高速光模块(EML/CW 芯片)的核心衬底材料,目前正面临严重的阶段性供需错配。

  • 产能与良率的漏斗:虽然理论产能庞大,但经过外延、晶圆切片等工序的良率损耗,最终有效出货量仅为初始的 9% 左右。其中,光模块应用占比不到一半,大量产能实则流向了低速电信光模块或射频器件领域。
  • 出口管制成核心变量:目前海外对 3-4 英寸高端磷化铟衬底需求极其旺盛(如 Coherent、Lumentum 扩产),但国内头部企业(如通美、云南锗业)因出口管制批文受限,海外出货量锐减 70%-80%。
  • 后续推演:国内企业目前仍在满产运行。若 2026 年 Q2 出口批文能顺利放开,将是重大行业利好;若迟迟不放开,企业积压的库存大概率将转内销,直接冲击国内 2-3 英寸中低端市场的价格,对上游材料商形成利空。
  • 商业航天加持:值得注意的是,除了磷化铟光通信逻辑,云南锗业等企业同时布局了商业航天等前沿领域,具备较强的多元化产业期权属性。

近期CPO消息汇总解读

先说我自己的结论:这轮所谓“CPO进展超预期”,真实含义是——它从纯概念变成了有交付、有项目、有供应商的导入期。
但另一句也要同时成立:市场把量级讲得太满了,10万台这种叙事水分很大。


1)先把路线说清:现在产业聚焦的是CPO,不是NPO

我更愿意把它拆成两句话记:

  • 英伟达体系:路线定调就是CPO。
  • CSP(云厂商)体系:更现实的是NPO先跑。

这两条并不矛盾:英伟达想要标准和系统能力,云厂商更在意成本/维护/议价权,路线自然分叉。


2)量级别被带节奏:今年更像“3–5万台”,10万台是期权

我对“今年小批量→明年规模化”的理解是这样:

  • 今年:3–5万台这种说法更像“能落地的保守量”。
  • 2027年10万台:要靠良率爬坡硬顶出来,不是口号。

这里的关键点只有一个:良率。CPO一旦良率不够,维护成本会吓退客户,尤其是微软/甲骨文这类更看成本的。


3)谁是真CPO链条、谁只是蹭概念:我会分三档看

第一档:现阶段“真供货/真核心”

  • 天孚通信、罗博特科、腾景、炬光科技
    我认同这四家是当前CPO叙事里标签最清晰、最能被“点名”的参与者。短期市场就认这四个。

第二档:远期期权(能做但还没进链)

  • 源杰科技这类光源头部:我会当成“供应商范围放开后的候选”,但你别指望明年就切入。两年左右才算合理预期。

第三档:关联度偏弱,容易变成纯概念

  • 永鼎股份、德科立这类,被你拿来硬贴CPO,我觉得站不住。
  • 另外,光纤环节不算CPO链条,别混。

4)中际旭创:我不担心业绩,但我承认它的“产业话语权”会被稀释

我对旭创的态度一直比较稳定:

  • 业绩端:短期不至于差,甚至还会增长(可插拔光模块产能还在扩,外加CPO/NPO会带来新增收入)。
  • 估值端:它的“核心角色”可能没以前那么独一份了。
    原因不是被同行干掉,而是CPO这条新路线把产业重心分流。这会让市场愿意给它的“溢价倍数”更摇摆——25倍、30倍、20倍、甚至更低,讨论空间变大。

一句话:我不怕它赚不到钱,我怕的是市场不愿意像以前那样给它“唯一性溢价”。


5)NPO这条线:核心参与者还是旭创、新易盛

我会把NPO理解成“云厂商侧的过渡路线”:

  • 需求主要在谷歌等CSP侧,
  • 参与者以中际旭创、新易盛这类光模块龙头为主。

NPO最大的问题不是“有没有需求”,而是没有统一标准:出了问题往往只能整体换,维护视角看确实糟心;但反过来,标准不统一也给了云厂商通过招投标压价的空间——对他们未必是坏事


6)英伟达 vs 博通:我更相信英伟达把CPO推快,但也更担心它“定价太狠”

这段我理解为:

  • 英伟达:更像纯需求方,推动CPO动力更强,所以进展更快。
  • 博通:自己在ASIC/DSP/EML等环节有既得利益,推进CPO反而利弊纠缠,节奏更曲折,还可能要靠台积电一起解决工艺。

同时,CPO越标准化,越容易变成“少数人定标准、别人交钱”的格局——这就是云厂商天然不舒服的点。


7)我怎么做“交易层面的取舍”

如果只看这份材料,我的取舍会很直接:

  • 要吃CPO能见度提升(短期叙事):优先盯“已经能供货”的四家(天孚/罗博特科/腾景/炬光)。
  • 要吃云厂商侧NPO(过渡路线):旭创、新易盛仍然是主角。
  • 要吃远期期权:源杰这种可以放观察池,但别当近端主线。
  • 纯概念的:我会尽量避开,因为一旦市场情绪退潮,最先被砸的就是它们。

LPU通俗易懂简介

LPU = Language Processing Unit,Groq 自己定义的一类“为大模型推理而生”的加速器。它的卖点不是“峰值算力”,而是:把一次推理(尤其是逐 token 生成)做成可预测、低延迟、高吞吐的流水线工厂

下面按“它是什么 → 为什么快 → 适合什么/不适合什么 → 对产业链的含义”讲清楚。


1)LPU到底是什么(Groq的核心定义)

Groq 把 LPU定义为一种**面向推理(inference)**的新处理器类别,强调跑 LLM 等模型时能做到更高速度、更低延迟、更高能效(相对 GPU)——前提是工作负载匹配它的设计目标。


2)它为什么“体感特别快”:确定性 + 静态调度(核心差异)

A. 关键概念:静态调度 + 确定性执行

Groq 的说法是:它的编译器会把整个执行图(包含跨芯片通信)提前算好并静态排程到时钟周期级别,运行时基本不需要GPU那套动态调度/抢占/复杂缓存一致性等机制,因此延迟更可控、抖动更小

这件事带来的直接效果:

  • TTFT(首 token 时间)更稳定(“不会忽快忽慢”)
  • tail latency 更少(尤其并发上来时不容易被队列/调度抖动拖垮)

Groq 自己在公开基准文章里也强调:因为确定性设计,API 响应时间波动范围更小。

B. 片上大容量 SRAM:把“喂数据”当成第一优先级

Groq 介绍 LPU 集成了数百 MB 级 SRAM作为主要权重存储(不是传统意义的 cache),目的是减少外部存取带来的等待,让计算单元持续吃饱。

直觉理解:GPU 很强但“系统很复杂”,LPU像“专门为LLM推理做的流水线”,把每一步怎么走提前排好,减少运行时的不确定开销。


3)LPU更适合哪些场景

更适合(通常能把优势发挥出来):

  • 实时交互:对 TTFT、稳定延迟敏感(客服、语音/同传、实时Agent)
  • 单用户/小batch 推理:追求“每个会话都快”,而不是“堆batch刷吞吐”
  • 流式输出:持续高 tokens/s 且抖动小(体感更顺)

这些方向基本就是 Groq 官方一直强调的“low latency / deterministic”路线。


4)它不擅长/需要警惕的点

  • 训练(training)不是它主战场:Groq主要定位推理,训练生态/通用性仍是GPU/TPU主导。
  • 超大模型/超大batch:GPU 通过大显存、成熟并行与生态,很多时候在“极端大模型或高batch吞吐成本”上仍有优势;也有人指出 Groq 某些部署需要大量芯片组网来容纳模型规模(取决于模型与配置)。
  • 生态与可移植性:GPU生态(CUDA、推理框架、算子、工程经验)仍然是壁垒;LPU更像“软硬一体的专用跑道”,要看你是否愿意适配它的编译/运行方式。

5)一句话对比:LPU vs GPU(你可以这样记)

  • GPU:通用大并行,强在广谱工作负载与生态;但推理时常有调度/队列/抖动问题,尤其低延迟场景要做很多工程优化。
  • LPU:推理专用流水线,强在确定性低延迟 + 高tokens/s + 低抖动,但更依赖适配、且不一定适合所有模型/所有batch模式。

大A渡劫史:“野人哥”波段交易框架

一、选股:三重筛选,我只抓“顺风车”

1)题材维度:先选“能讲得动”的主线

我会优先看:政策驱动、产业趋势(新能源/AI等)、事件催化(发布会、行业峰会)。题材要有“想象空间”,看渗透率、政策支持、资金关注度(成交量、涨停家数)。

另外,板块还要分梯队:前排龙头(先涨停、封单稳)可以格局;中位股只能快进快出;后排跟风就别恋战。

2)技术维度:20日线当生命线

我会硬性要求:股价在20日线之上运行;回踩20日线是重要低吸点。

量能节奏也要对:最近成交量最好是“放量启动 + 缩量回调”,回调时别继续放大量(那多半是泄劲)。

3)筹码维度:别碰“套牢盘墙”

我会避开上方明显压力位,找筹码峰值靠近现价、上方相对干净的。再加一条很实用的过滤:流通市值别太极端(文里给的是50–200亿更舒服),最好股性活、近期有过涨停更容易走趋势。


二、入场:只认两种买点(简单但够用)

1)趋势启动点

突破前期小平台,同时放量(量比≥2),题材处于发酵期——我会把这当“第一买点”。

典型就是:热点题材新龙头刚破平台、20日线拐头向上。

2)回踩低吸点

回踩20日线时,满足“缩量 + 不破20日线支撑”,且题材热度未退(板块里还有其他股在涨)。

我的做法更偏稳:回踩先建底仓(3–5成),后面如果出现“阳包阴”、或放量再摸高点,再加到7–8成。


三、持仓:动态波段,别一根筋

盈利阶段怎么处理?

  • 放量滞涨、或跌破5日线:先减1/3,留底仓看。
  • 板块仍强、个股回踩20日线获得支撑:底仓可考虑再加。

回调阶段怎么处理?

  • 回踩成本线:不犹豫止损(哪怕很快拉回,也先保本金)。
  • 如果从比如20%利润回撤到只剩5%:我会先判断题材是不是还热;热就留底仓,不热就清掉走人。

四、离场:我更喜欢“先定义退出”,再谈盈利

止盈:目标一轮20%–30%

到了就分批落袋,把本金拿回来滚下一轮。

同时盯两个“见顶味道”的信号:放量跌停连续3日缩量阴跌、或板块龙头明显熄火——这种我会直接清仓。

止损:硬的更好执行

  • 硬止损:跌破成本线约3%立刻走。
  • 软止损:题材逻辑被证伪(政策不如预期、行业数据走坏),或板块从前排跌成后排——我也会走。

五、心态:我觉得这段最值钱

  • 买前把“逻辑闭环”写清楚:题材、技术形态、筹码支撑点。买完还慌,说明你其实没想明白。
  • 接受“利润回吐”:波段里5%–10%回撤很正常,只要不破关键位就别自己吓自己。
  • 新手别上来就满仓:1–2成练手,靠复盘把“买点—持仓—卖点”记录成自己的数据库。