ICC訊——光子芯片初創公司Q.ANT近日完成了A輪融資,使其總融資額達到8000萬美元。同時,公司宣布與于利希超算中心(Jülich Supercomputing Centre)建立為期四年的合作伙伴關系,共同探索其技術的潛在應用。這家德國公司還發布了第二代芯片Q.ANT NPU 2以及更新的軟件棧,支持在芯片上進行訓練。
Q.ANT首席執行官Michael F?rtsch向《EE Times》表示,公司并未專注于大語言模型推理加速,而是更關注下一代技術發展。他指出,盡管大量工作和資金已投入大語言模型的執行,但投資回報仍未顯現。因此,Q.ANT將聚焦于圖像、音頻和視頻網絡等更復雜的神經網絡架構,這些領域目前仍難以實現規模化。
技術路徑:聚焦非線性計算與實時視頻
F?rtsch闡述了公司的愿景:通過第三代系統實現基于AI的實時視頻流處理,以每秒100幀的速率對4K圖像進行實時推理。他認為,這正是CMOS技術目前不足的領域,不僅在性能和計算密度上,在能耗方面也存在短板。
Q.ANT的芯片基于薄膜鈮酸鋰技術,具體采用600納米厚的絕緣體上鈮酸鋰層。TFLN的非線性光學特性能夠自然加速非線性數學運算,為數據中心節省能源。公司位于德國斯圖加特微電子研究所的90納米TFLN光子計算芯片生產線已于今年初投產。F?rtsch表示,該生產線產出的第一代芯片及其服務器已在云端提供演示。
在本月的SC 2025會議上,Q.ANT演示了其第一代NPU運行Kolmogorov-Arnold網絡與在CPU上運行的多層感知器(更接近主流AI)在學習圖像和重建方面的對比。KAN的參數數量約為MLP的一半。在相同訓練周期和類似時間范圍內,運行頻率為200 MHz的NPU比運行頻率為2.4 GHz的CPU產生了更接近原始數據的圖像。F?rtsch強調,這一結果在多種圖片測試中保持一致,因為公司能夠利用非線性方程系統,以更少的參數描述模型,使最終結果更接近真實情況。
第二代芯片:性能提升與軟件優化
Q.ANT的第二代芯片性能顯著提升,從第一代的1 MOPS增至8 GOPS。但F?rtsch謹慎指出,這些操作比乘累加運算更復雜,不能與標準深度學習加速器的性能數據直接比較。芯片時鐘頻率從200 MHz提高到2 GHz,NPU運行功耗約為150 W。
該芯片擁有八個獨立通道(并行操作)。F?rtsch表示,公司已測試更多通道的芯片,但光學部分受限于系統的數字部件,如存儲器、ADC和DAC。選擇八通道設計是基于生產線上足夠的良品率和穩定的工藝考慮。
軟件方面的工作使得單個CPU主機能夠驅動八個Q.ANT PCIe卡(每卡一個加速器芯片)。公司的模型庫包含內部開發的新算法和網絡架構,以最大化利用Q.ANT硬件優勢。F?rtsch解釋說,這是一套更智能的算法集,能夠用更少數據獲得相同甚至更好的結果。算法設計匹配處理器能力,重點關注正弦、余弦、卷積、傅里葉變換等在該處理器上表現強勁的基本函數,并根據NPU最強原語進行算法映射。
對于現有應用,Q.ANT的技術使傅里葉變換等函數可以直接作為原語推送到硬件執行,無需轉換為更簡單的數學形式。F?rtsch認為,當前AI數學本質優美,但在處理器上的執行方式仍顯粗暴,不夠優雅。
合作與客戶進展
Q.ANT與于利希研究中心旗下的于利希超算中心的新合作將探索光子計算的應用可能性及其與經典計算的集成。作為協議的一部分,JSC將購買一臺Q.ANT服務器。
現有客戶萊布尼茨超算中心已安裝三臺Q.ANT服務器,混合搭載第一代和第二代硬件。作為領先客戶,LSC率先獲得了支持Q.ANT芯片非線性數學運算的軟件更新,目前正在對第二代芯片進行性能表征。配備公司第二代處理器的Q.ANT服務器預計將于2026年上半年發貨。
原文:https://www.eetimes.com/q-ant-raises-series-a-debuts-second-gen-tfln-photonic-chip/