ICC訊 拉斯維加斯AWS re:Invent大會(huì)現(xiàn)場(chǎng)——今年,AWS可謂手握一手好牌。首席執(zhí)行官M(fèi)att Garman在主題演講中重點(diǎn)介紹了兩項(xiàng)AI基礎(chǔ)設(shè)施公告以及三項(xiàng)模型更新。以下是你需要了解的此次大會(huì)重點(diǎn)。
AI工廠登場(chǎng),電信運(yùn)營(yíng)商面臨挑戰(zhàn)
AWS首次推出了其“AI工廠”產(chǎn)品。該產(chǎn)品將允許客戶在其現(xiàn)有的數(shù)據(jù)中心空間內(nèi)部署AWS芯片、網(wǎng)絡(luò)和AI服務(wù)以及英偉達(dá)的計(jì)算平臺(tái),以滿足AI計(jì)算和數(shù)據(jù)主權(quán)兩方面的需求。
一方面,看到AWS發(fā)布此消息實(shí)在令人遺憾。原因在于,“AI工廠”曾是電信運(yùn)營(yíng)商如何避免重蹈“啞管道”覆轍的一個(gè)答案。德國(guó)電信、Orange、瑞士電信和Telenor等運(yùn)營(yíng)商已開(kāi)始朝著正確的方向邁出試探性的步伐。但當(dāng)它們還在摸索,并且以典型的電信業(yè)速度緩慢推進(jìn)時(shí),AWS卻早已忙于構(gòu)建企業(yè)和公共部門(mén)客戶正在尋找的完整方案。
另一方面,我們?cè)缇皖A(yù)言過(guò)結(jié)局會(huì)是這樣。在數(shù)據(jù)主權(quán)方面,電信運(yùn)營(yíng)商可能仍有一些角色可以扮演,但AWS已經(jīng)明確將目標(biāo)對(duì)準(zhǔn)了那些有監(jiān)管和主權(quán)要求的客戶,并宣揚(yáng)其能夠在公司現(xiàn)有設(shè)施中部署專用基礎(chǔ)設(shè)施的能力。
AvidThink創(chuàng)始人兼負(fù)責(zé)人Roy Chua認(rèn)為,這項(xiàng)發(fā)布可能具有雙重影響。他告訴Fierce,雖然AWS AI工廠“可能被視為與一些電信運(yùn)營(yíng)商的舉措存在競(jìng)爭(zhēng)關(guān)系”,但運(yùn)營(yíng)商也“可以將AI工廠視為一種讓AWS幫助其建立自身私有AI能力的方式——即電信運(yùn)營(yíng)商可以為自己業(yè)務(wù)利用的、獨(dú)立的私有AI基礎(chǔ)設(shè)施”。我們猜想,他們別無(wú)選擇,只能設(shè)法從這些挑戰(zhàn)中尋找機(jī)遇。
芯片重磅發(fā)布:Trainium 3上市,Trainium 4預(yù)覽
re:Invent大會(huì)上還有兩條重要的芯片新聞。第一條是關(guān)于Trainium 3的全面上市。這款A(yù)I訓(xùn)練芯片是AWS在去年的re:Invent大會(huì)上宣布的。與上一代芯片相比,Trainium 3提供了4.4倍的計(jì)算能力、3.9倍的內(nèi)存帶寬,以及每毫瓦功耗下5倍的AI令牌處理能力。
AWS還預(yù)告了仍在開(kāi)發(fā)中的Trainium 4。Garman表示,與Trainium 3相比,下一代芯片將提供6倍的FP4性能、4倍的內(nèi)存帶寬和2倍的內(nèi)存容量。
但這些性能提升并不一定意味著AWS正在試圖挑戰(zhàn)英偉達(dá)。Futurum Group首席執(zhí)行官Daniel Newman告訴Fierce:“我不知道誰(shuí)需要聽(tīng)到這個(gè),但并非每一款新發(fā)布的AI芯片都‘旨在與英偉達(dá)競(jìng)爭(zhēng)或擊敗它’。我們正處在一個(gè)巨大技術(shù)超級(jí)周期的開(kāi)端,每一款能為AI生產(chǎn)的芯片都在熱銷(xiāo)。”也就是說(shuō),市場(chǎng)需求足夠大,足以讓所有參與者分得一杯羹,這不是一場(chǎng)零和游戲。
盡管如此,F(xiàn)uturum Group副總裁兼AI平臺(tái)實(shí)踐負(fù)責(zé)人Nick Patience告訴Fierce,如果Trainium能夠“突破‘溢出需求’的定位,獲得廣泛的財(cái)富500強(qiáng)企業(yè)采用”,那對(duì)亞馬遜來(lái)說(shuō)可能是一個(gè)巨大的福音。不過(guò),到目前為止,這尚未發(fā)生。
模型家族更新與應(yīng)對(duì)技術(shù)債務(wù)的新工具
AWS在其N(xiāo)ova基礎(chǔ)模型家族中推出了一系列新選項(xiàng)。其中包括適用于各種工作負(fù)載的“主力模型”Nova Lite、用于智能推理的Nova 2 Pro,以及具有先進(jìn)多模態(tài)輸入輸出能力的Nova 2 Omni。
AWS還推出了Nova Forge服務(wù)。Garman介紹,這項(xiàng)服務(wù)引入了開(kāi)放式訓(xùn)練模型的概念。也就是說(shuō),F(xiàn)orge允許企業(yè)在Nova訓(xùn)練過(guò)程中的各個(gè)檢查點(diǎn)注入其專有數(shù)據(jù),從而創(chuàng)建可在Amazon Bedrock中使用的定制化“Novellas”模型。索尼是Nova Forge的使用者之一,他們利用該工具創(chuàng)建了一個(gè)基于Nova 2的內(nèi)部模型,以改進(jìn)其合規(guī)實(shí)踐。
可以將這視為超越了檢索增強(qiáng)生成技術(shù)的一步。AWS不僅僅是讓企業(yè)在其數(shù)據(jù)上進(jìn)行推理查詢,而是真正將這些數(shù)據(jù)整合到模型訓(xùn)練過(guò)程中,以創(chuàng)建定制模型。我們認(rèn)為這有可能進(jìn)一步推動(dòng)Trainium的采用,因?yàn)門(mén)rainium就是為處理此類微調(diào)工作負(fù)載而設(shè)計(jì)的。
除了模型更新,亞馬遜還推出了新的Frontier Agents。你可以在這里閱讀更多相關(guān)信息,以及圍繞該公司AI快速進(jìn)展引發(fā)的爭(zhēng)議。
應(yīng)對(duì)技術(shù)債務(wù)
AWS也在利用智能體AI的力量來(lái)應(yīng)對(duì)技術(shù)債務(wù)。AWS Transform正在獲得一套新的智能體AI工具集,旨在加速舊有企業(yè)代碼和應(yīng)用程序的現(xiàn)代化改造,并且能夠跨任何API、框架、架構(gòu)或語(yǔ)言工作。
考慮到阻礙AI應(yīng)用的技術(shù)債務(wù)規(guī)模驚人,這顯然是一件大事。正如Garman在臺(tái)上指出的,埃森哲估計(jì)技術(shù)債務(wù)每年給美國(guó)企業(yè)造成總計(jì)2.4萬(wàn)億美元的損失,而高德納咨詢公司發(fā)現(xiàn)70%的IT預(yù)算被遺留系統(tǒng)消耗。
事實(shí)上,AWS并非唯一致力于解決此問(wèn)題的公司。微軟在五月份通過(guò)GitHub CoPilot推出了AI驅(qū)動(dòng)的應(yīng)用程序現(xiàn)代化功能。
值得注意的是,AWS特別瞄準(zhǔn)了Windows現(xiàn)代化,宣稱其智能體是一種快速簡(jiǎn)便的方法,可以將.NET應(yīng)用程序、SQL Server和舊版用戶界面升級(jí)到不受許可協(xié)議約束的開(kāi)源替代方案。還有用于大型機(jī)和VMware遷移的新智能體。
Chua告訴Fierce,這些新工具可能有助于加速云遷移,并最終“為AI/其他投資釋放資源”。他補(bǔ)充說(shuō),電信運(yùn)營(yíng)商甚至可能受益,或許能夠利用這些工具來(lái)改造“諸如計(jì)費(fèi)和OSS/BSS等已有數(shù)十年歷史的核心系統(tǒng)”。
原文:https://www.fierce-network.com/cloud/heres-what-we-think-aws-big-reinvent-news