ICC訊 (作者 Julie Bort)任何公司,無論大小,真的能撼動英偉達(dá)在AI芯片領(lǐng)域的主導(dǎo)地位嗎?或許不能。但亞馬遜CEO Andy Jassy本周表示,對于那些哪怕能從中分得一部分份額的公司來說,仍有數(shù)千億美元的收入機(jī)會。
正如預(yù)期,在AWS re:Invent大會上,公司發(fā)布了其下一代對標(biāo)英偉達(dá)的AI芯片Trainium3,其速度比當(dāng)前的Trainium2快4倍,且功耗更低。Jassy在X上的一篇帖子中透露了關(guān)于當(dāng)前Trainium芯片的一些細(xì)節(jié),這解釋了公司為何對該芯片如此樂觀。
他表示,Trainium2業(yè)務(wù)“已獲得實質(zhì)性進(jìn)展,是一項年化營收達(dá)數(shù)十億美元的業(yè)務(wù),擁有超過100萬顆芯片投產(chǎn),以及超過10萬家公司正在使用它,這構(gòu)成了目前Bedrock使用量的主要部分。” Bedrock是亞馬遜的AI應(yīng)用開發(fā)工具,允許公司在眾多AI模型中進(jìn)行選擇和組合。
性價比優(yōu)勢與關(guān)鍵客戶
Jassy說,亞馬遜的AI芯片正在其龐大的云客戶名單中勝出,因為它“相比其他GPU選項具有引人注目的性價比優(yōu)勢”。換言之,他認(rèn)為它比市場上那些“其他GPU”性能更好,成本更低。這當(dāng)然是亞馬遜的經(jīng)典策略:以更低的價格提供其自研技術(shù)。
此外,AWS CEO Matt Garman在接受CRN采訪時提供了更多信息,透露了其中一個對數(shù)十億美元營收貢獻(xiàn)巨大的客戶:毫不意外,就是Anthropic。Garman表示:“我們看到Trainium2獲得了巨大的市場吸引力,特別是來自我們的合作伙伴Anthropic。我們已經(jīng)宣布了‘雷尼爾計劃’,其中超過50萬顆Trainium2芯片正幫助他們?yōu)镃laude構(gòu)建下一代模型。”
“雷尼爾計劃”是亞馬遜最雄心勃勃的AI服務(wù)器集群,分布在美國多個數(shù)據(jù)中心,旨在滿足Anthropic激增的需求。它已于10月上線。當(dāng)然,亞馬遜是Anthropic的主要投資者。作為交換,Anthropic將AWS作為其主要模型訓(xùn)練合作伙伴,盡管Anthropic現(xiàn)在也通過英偉達(dá)芯片在微軟云上提供服務(wù)。
OpenAI現(xiàn)在也開始在微軟云之外使用AWS。但這家云巨頭表示,與OpenAI的合作對Trainium的營收貢獻(xiàn)不大,因為AWS是在英偉達(dá)芯片和系統(tǒng)上運行其服務(wù)。
競爭格局與技術(shù)挑戰(zhàn)
事實上,只有像谷歌、微軟、亞馬遜和Meta這樣少數(shù)美國公司擁有所有的工程要素——芯片設(shè)計專長、自研高速互連和網(wǎng)絡(luò)技術(shù)——才能嘗試與英偉達(dá)進(jìn)行真正的競爭。(請記住,英偉達(dá)在2019年壟斷了一項主要的高性能網(wǎng)絡(luò)技術(shù)市場,當(dāng)時CEO黃仁勛出價高于英特爾和微軟,收購了InfiniBand硬件制造商Mellanox。)
除此之外,為英偉達(dá)芯片服務(wù)而構(gòu)建的AI模型和軟件也依賴于英偉達(dá)專有的計算統(tǒng)一設(shè)備架構(gòu)軟件。CUDA允許應(yīng)用程序使用GPU進(jìn)行并行處理計算等任務(wù)。就像昔日的英特爾與SPARC芯片大戰(zhàn)一樣,為非CUDA芯片重寫AI應(yīng)用程序并非易事。
盡管如此,亞馬遜可能對此已有計劃。正如我們此前報道,其下一代AI芯片Trainium4將被設(shè)計成能在同一系統(tǒng)中與英偉達(dá)的GPU互操作。這是否有助于從英偉達(dá)手中爭取更多業(yè)務(wù),還是僅僅鞏固其在AWS云上的主導(dǎo)地位,仍有待觀察。
亞馬遜的獲勝邏輯
這可能對亞馬遜來說并不重要。如果它已經(jīng)通過Trainium2芯片走上創(chuàng)造數(shù)十億美元營收的軌道,而下一代芯片將更出色,這或許就足以讓它成為贏家。