全光Scale up的落地,核心依赖物理层与网络层的双重突破,NPO(近封装光互联)与OCS(光电路交换机)分别扛起关键大旗,共同推动全光技术向规模化、高效化演进。
| 物理层:从可插拔→NPO→CPO→OIO演进,缩短光电转换距离、提升互联密度
光互联模块封装方式从“可插拔 → NPO → CPO → OIO”演进,可逐步拉近计算芯片与OE(光电器件)之间的距离,缩短电信号传输路径,减少损耗和延迟,提升数据传输效率。
· 主流可插拔光模块正向LPO演进,通过去除传统光模块中的DSP,显著降低了延迟和功耗,同时具备良好的可维护性和成本优势;
· NPO将OE与封装后的计算芯片相邻布局于同一块高性能PCB基板上,通过极短的高性能电气链路相连,使电信号传输距离在数厘米以内;
· CPO将OE与未封装好的计算芯片共同封装在同一芯片基板或中介层上,实现系统的高集成度,使电信号只需传输几毫米;
· OIO通过先进封装使OE以芯粒形式与计算芯片集成,彻底摒弃传统的铜线电气I/O,消除板级电气走线的瓶颈。
当前,可插拔光模块仍为市场主流,但中期面临技术转型压力,需适应多元化技术生态和智能化发展趋势;CPO和OIO受制于技术成熟度、量产良率与成本控制等因素,尚未进入商业化落地阶段;而NPO得益于不占用设备面板空间、天然与主芯片解耦、易于标准化、可维护性强等优势,有望成为CPO时代来临前的主导技术。

▲光互联模块封装方式演进,来源:日月光
近日,阿里云宣布全球首款基于OIF标准封装的3.2T NPO模块成功点亮,标志着近封装光互联技术进入可量产的新阶段。
该模块基于两颗16通道收发一体硅光芯片,搭配线性直驱Driver/TIA芯片,采用成熟的2D封装工艺,将PIC与EIC倒装集成于mSAP基板上,具备快速量产潜力。该模块在仅22.5mm × 35.1mm的尺寸内实现3.2Tb/s传输带宽,通过标准LGA连接器实现光引擎与主芯片物理与电气解耦,延续了开放、繁荣的光模块生态。同时,该模块支持硅光与VCSEL两种技术路线,可灵活适配不同距离与应用场景。

▲阿里云3.2T NPO模块形态图,来源:讯石光通讯网
作为阿里云UPN512架构的核心技术,NPO使XPU可通过光互联直接连接交换机,借助单层CLOS拓扑实现512颗XPU全互联,彻底淘汰机柜内高速铜缆,显著降低布线复杂度、散热负担、供电需求及运维成本。

▲UPN512单层光互联系统,来源:UPN512技术架构白皮书v1.0
据悉,阿里云已将3.2T NPO技术率先应用于新一代国产四芯片交换机中,该设备单机总交换容量达102.4T,并可通过升级至4×102.4T芯片平滑演进至409.6T平台。目前,该交换机已完成整机上电与核心功能验证,NPO端口实现稳定链路建立,项目正式进入长期可靠性测试阶段。

▲基于NPO的国产四芯片交换机硬件架构图,来源:讯石光通讯网
| 网络层:采用OCS光交换机替代OEO电交换机,实现更高效的光域信息传输
相较于OEO电交换机,OCS光交换机具有以下优势:
· 对速率不敏感且能实现不同传输速率之间灵活切换,支持更快速的扩容和扩展;
· 光路交换不依赖固定速率,可以充分利用光纤的全部容量,使网络资源利用更加高效;
· OCS无需光电转换,能够显著降低功耗;
· OCS天然的可扩展性能够支持更多端口与更高聚合吞吐量,无需频繁升级。
当前,以谷歌和英伟达为代表的头部厂商已经开展了诸多Scale up领域的OCS应用尝试。
谷歌率先实现OCS商业化应用,其TPU v4采用48台OCS实现4096颗TPU互联,构建了超大规模Scale up集群;其TPU v7(Ironwood)采用48台OCS实现9216颗TPU互联,单集群算力达EFLOPS级。
英伟达与哥伦比亚大学联合发表ACTINA架构论文,提出了基于递归定义的OCS BCube拓扑,该架构将GPU直接连接到OCS,具备多维直连、边缘可重构、多维映射等特征。

▲谷歌在Scale up领域的OCS应用,来源:FUTUREWEI Technologies

▲英伟达在Scale up领域的OCS应用探索,来源:ACTINA