1、 什么是光交换机(OCS)?
光交换机(Optical Circuit Switch, OCS)指的是基于全光信号的交换机设备,其工作原理是通过配置光交换矩阵,从而在任意输入和输出端口间建立光学路径以实现信号的交换。相较于电交换机,OCS无需光电信号转换和相应的数据包处理过程,可显著降低时延和功耗,系统故障概率也有所降低,且OCS无需进行端口速率的频繁迭代,通过单纯的光路重定向即可实现跨代设备的无缝互联,可大幅提高硬件使用寿命。
电交换机(EPS)就像繁忙的邮局:当数据包(信件)抵达时,邮递员(交换机处理器)需要先读取地址信息(数据包头),再对信件进行分类,最后将其重新纳入邮件流继续传输。这种读取、分类和重定向的过程不仅会造成延迟,还会消耗大量电能。这就是所谓的光-电-光转换。
光电路交换机(OCS)则如同自动化铁路调车场:当列车(光信号)抵达时,系统仅需重新配置物理轨道,即可创建从起点到终点之间的直达且不间断的传输路径,无需开启车厢或读取内容,数据便能沿着专用物理线路以光速传输。这种设计彻底消除了传统光-电-光转换过程中存在的延迟与能耗问题。
2、AI大模型持续迭代,Scale-Up/Scale-Out/Scale-Arcoss场景催生OCS需求
AI网络架构分为Scale-Up、Scale-Out、Scale-Across三种。
纵向扩展(Scale-Up):单节点性能的垂直强化,典型方式为增加柜内GPU数量、提升机柜内存容量/吞吐量等。
横向扩展(Scale-Out):多节点协同,通过增加同构/异构节点构建分布式集群,典型方式为增加集群内服务器数量。
跨数据中心扩展(Scale-Across):将地理上分散的多个数据中心互联成更大规模的超级 AI 工厂,使其协同运行单一 AI任务。
AI大模型训练需要海量GPU/TPU协同计算,对通信传输带宽、时延、功耗提出了极高要求,而OCS技术凭借其高带宽、低延迟、低功耗的特性,完美适配AI算力集群中Scale-up(例如:谷歌TPUv4集群)、Scale-out(例如:谷歌在Jupiter架构引入OCS替代Spine层)和Scale-across(例如:英伟达DCI跨数据中心互联)对高效、灵活互联的核心需求。
3、OCS光交换机有哪几种技术路线?
光交换技术一般可分为MEMS、数字液晶、直接光束偏转 DLBS、硅光波导技术四类。
MEMS技术:系统由输入 / 输出光纤准直器阵列(FAU)和 MEMS 微镜阵列构成完整的 N×N 光开关矩阵。工作原理是通过电信号精确控制镜的二维转角度,将输入光信号准导向目标出口。MEMS 微镜采用半导体工艺制造,镜面直径约数百微米,主要采用静电梳齿驱动方式,通过调节偏置电压实现精确的角度控制。这是目前市场上的主流技术,市场份额超过 70%,技术成熟度高,端口扩展能力强,具有性能与成本的均衡性。谷歌和 Lumentum 等厂商均以 MEMS 方案为主。Lumentum 是谷歌 OCS 的关键合作伙伴,不仅是现阶段的供应商之一,还是谷歌下一代 OCS 方案的潜在整机提供商。
数字液晶(DLC)/硅基液晶(LCoS)技术:利用外加电场改变液晶分子排列,从而影响入射光的偏振状态,再配合偏振分束器来实现光路的切换。输入光会被分解为横向和纵向两个偏振分量,在光开关中分别进行处理,最后在输出端重新合并。数字/硅基液晶方案无运动部件,成本较低;但其切换速度较慢,适用于无需频繁切换的场景。Coherent是该方案的主要推动者,既有DLC又有LCoS技术方案布局,产品较为成熟。
直接光束偏转CLBS技术(又称压电陶瓷方案):利用压电陶瓷在电压控制下能够沿某一轴向发生尺寸变化的特性实现光路的交换。该方案采用压电陶瓷驱动器直接控制光纤准直器的空间位置和角度,通过机电耦合效应产生微位移,使输入输出端口的准直器实现精确对准。该技术光路简洁,传输损耗较低,但随着端口数增加,大角度对准时的机械位移需求会制约扩展规模。该方案的主要推动者为Polatis。
硅光波导:在硅基芯片上构建出结构确定的光路矩阵,光信号沿着预设的路径传输。理论上其切换速度可以达到微秒甚至纳秒级别。目前面临的主要问题是损耗较高,而且在多通道场景下容易产生串扰和可靠性问题。光波导方案适合高密度集成应用,当前尚未大规模商用,主要由iPronics等公司推动。