ICC訊 2025年被證明是共封裝光學(CPO)發展的關鍵一年。今年三月,Nvidia率先宣布為其InfiniBand和以太網交換機推出200G/通道的CPO產品。九月末,Meta公布的測試數據展示了Broadcom前兩代CPO卓越的可靠性。十月,Broadcom推出了其第三代200G/通道CPO。在本周的TEF活動上,Nvidia報告稱,基于CPO交換機的AI集群的彈性相比使用可插拔光模塊的系統提升了10倍。這種高彈性轉化為GPU利用效率5倍的提升——這是一項重大突破!高可靠性的益處,遠遠超過了CPO開發者最初追求的低功耗優勢。
12月2日,Marvell宣布以32.5億美元收購開發下一代CPO的初創公司Celestial AI。作為對比,Ciena在2025年9月為另一家共封裝光學初創公司Nubis Communications僅支付了2.7億美元。Celestial AI的技術基于光子中介層(Photonic interposers),與Lightmatter的方法類似。這兩家公司都在2025年初獲得了數億美元的融資。
技術協同與市場定位
下圖展示了Celestial AI的“光子互聯架構”如何融入Marvell的連接產品組合。它雖然是整個拼圖的一小塊,但對公司的未來可能至關重要。它與“即將推出”的UALink和ESUN交換芯片(左下角)具有協同效應。ESUN代表用于縱向擴展網絡(Scale-Up Networking )的以太網,在我們看來,這正是真正需要CPO的領域。
主要風險因素在于Celestial AI所提出的技術。光子中介層提供了令人興奮的可能性,但它對當前如CoWoS等中介層技術具有極大的顛覆性。這可能是未來的正確方向,但距離投產(在我們看來)還有數年時間。為了彌合這一差距,我們預計Celestial的初始產品將是可與傳統XPU共封裝的光學引擎小芯片。這種方法類似于Lightmatter的Passage L200光學引擎,后者通過UCIe與XPU或交換機連接。
可靠性挑戰與產業前景
Broadcom和Nvidia的CPO可靠性非常出色,但對于與AI集群的“心臟”——XPU的集成而言,可能還不夠。交換機更像手臂和腿,如果其中一個損壞,整個系統仍能運行。XPU確實會發生故障,業界也有應對這些故障的方法,但任何添加到它們內部的新組件都將受到極其嚴格的審視。要實現XPU與CPO的完全整合,需要包括Marvell在內的所有領先供應商的共同努力。