今天想来写一下 光通讯 (Optical Communication),受到 @woodycryptow 和 @xingpt 对话中的启发。什么是光通讯?他和传统@woodycryptow 和 @xingpt 对话中的启发。第一次研究这个赛道,欢迎指正。 1️⃣什么是光通讯?他和传统的通讯有什么不同? 光通讯通常依靠光纤来传输数据,速度快、损耗小。 从跨国网络到数据中心,光通信是现代电信和互联网的骨干,帮助我们实现又快又稳定的数据传输。 以往我们采取铜缆传输(electrical interconnect),这也是今年铜价上升的驱动力之一。 2️⃣为何光通讯崛起,光进铜退? AI算力的爆炸式增长(尤其是大模型训练)对数据中心内部与之间的数据传输带宽提出了前所未有的要求。 传统的 铜缆传输已经无法满足速度、功耗、距离要求; 因此, AI算力中心从“电信号传输”快速转向“光信号传输”,即所谓的「光进铜退」。 3️⃣AI驱动“光进铜退”的三个关键阶段 数据中心内的信息传输-数据中心之间的信息传输-芯片级光互连(下一代革命性方向) 🌟主要先说说数据中心内的信息传输: 服务器 → GPU → 交换机之间的内部通信 每个AI训练集群包含成千上万张GPU卡(H100/B200),GPU之间需要高速低延迟通信。 eg. 一个 NVIDIA Hopper 集群可能包含 10 000 张 H100 GPU,这些 GPU 每秒需要交换上百 TB 的数据。 若通信延迟或带宽不足,训练效率直接掉 30-50%。 主流技术方向: 400G → 800G → 1.6T 光模块 Co-Packaged Optics (CPO, 光电共封装) Linear-Drive optics (LPO, 无DSP光模块) 受益公司: 美国:Broadcom ( $AVGO)、Coherent ( $COHR)、Marvell ( $MRVL ) 中国:中际旭创、新易盛、天孚通信、光迅科技 4️⃣现在已经进展到哪里了(真实进展与新闻) NVIDIA Spectrum-X 全光AI网络 2024 GTC 发布,基于 400 G InfiniBand / Ethernet 全光架构。 目标:支撑上万 GPU 的同步训练,延迟 降低 30%,能效 提升 40%。 来源:NVIDIA GTC 2025 光网络发布 Broadcom 推出 1.6 Tbps 光互连方案 推动数据中心内部由 800 G 向 1.6 T 过渡,针对 AI 互连。 来源: – Broadcom Advances AI Data Center Interconnect Technology Marvell LPO(线性光模块)量产 移除昂贵 DSP 芯片,功耗 降 30%,已被多个 AI 集群采用。 来源:Marvell 官方 2025 新闻稿。 中际旭创/天孚通信 已向北美云厂(Microsoft、Amazon、Google)大量供货 800G 光模块。 预计 2025-2026 过渡至 1.6 T 新产品线。 硅光 (Silicon Photonics) Intel、Ayar Labs 等正推进“Chip-to-Chip Optical I/O”, 未来 GPU/CPU 间将以光直接互连,延迟降低 90%。
$COHR 和 $MRVL 类比
9.36K