ICC訊 拉斯維加斯AWS re:Invent大會現場——今年,AWS可謂手握一手好牌。首席執行官Matt Garman在主題演講中重點介紹了兩項AI基礎設施公告以及三項模型更新。以下是你需要了解的此次大會重點。
AI工廠登場,電信運營商面臨挑戰
AWS首次推出了其“AI工廠”產品。該產品將允許客戶在其現有的數據中心空間內部署AWS芯片、網絡和AI服務以及英偉達的計算平臺,以滿足AI計算和數據主權兩方面的需求。
一方面,看到AWS發布此消息實在令人遺憾。原因在于,“AI工廠”曾是電信運營商如何避免重蹈“啞管道”覆轍的一個答案。德國電信、Orange、瑞士電信和Telenor等運營商已開始朝著正確的方向邁出試探性的步伐。但當它們還在摸索,并且以典型的電信業速度緩慢推進時,AWS卻早已忙于構建企業和公共部門客戶正在尋找的完整方案。
另一方面,我們早就預言過結局會是這樣。在數據主權方面,電信運營商可能仍有一些角色可以扮演,但AWS已經明確將目標對準了那些有監管和主權要求的客戶,并宣揚其能夠在公司現有設施中部署專用基礎設施的能力。
AvidThink創始人兼負責人Roy Chua認為,這項發布可能具有雙重影響。他告訴Fierce,雖然AWS AI工廠“可能被視為與一些電信運營商的舉措存在競爭關系”,但運營商也“可以將AI工廠視為一種讓AWS幫助其建立自身私有AI能力的方式——即電信運營商可以為自己業務利用的、獨立的私有AI基礎設施”。我們猜想,他們別無選擇,只能設法從這些挑戰中尋找機遇。
芯片重磅發布:Trainium 3上市,Trainium 4預覽
re:Invent大會上還有兩條重要的芯片新聞。第一條是關于Trainium 3的全面上市。這款AI訓練芯片是AWS在去年的re:Invent大會上宣布的。與上一代芯片相比,Trainium 3提供了4.4倍的計算能力、3.9倍的內存帶寬,以及每毫瓦功耗下5倍的AI令牌處理能力。
AWS還預告了仍在開發中的Trainium 4。Garman表示,與Trainium 3相比,下一代芯片將提供6倍的FP4性能、4倍的內存帶寬和2倍的內存容量。
但這些性能提升并不一定意味著AWS正在試圖挑戰英偉達。Futurum Group首席執行官Daniel Newman告訴Fierce:“我不知道誰需要聽到這個,但并非每一款新發布的AI芯片都‘旨在與英偉達競爭或擊敗它’。我們正處在一個巨大技術超級周期的開端,每一款能為AI生產的芯片都在熱銷。”也就是說,市場需求足夠大,足以讓所有參與者分得一杯羹,這不是一場零和游戲。
盡管如此,Futurum Group副總裁兼AI平臺實踐負責人Nick Patience告訴Fierce,如果Trainium能夠“突破‘溢出需求’的定位,獲得廣泛的財富500強企業采用”,那對亞馬遜來說可能是一個巨大的福音。不過,到目前為止,這尚未發生。
模型家族更新與應對技術債務的新工具
AWS在其Nova基礎模型家族中推出了一系列新選項。其中包括適用于各種工作負載的“主力模型”Nova Lite、用于智能推理的Nova 2 Pro,以及具有先進多模態輸入輸出能力的Nova 2 Omni。
AWS還推出了Nova Forge服務。Garman介紹,這項服務引入了開放式訓練模型的概念。也就是說,Forge允許企業在Nova訓練過程中的各個檢查點注入其專有數據,從而創建可在Amazon Bedrock中使用的定制化“Novellas”模型。索尼是Nova Forge的使用者之一,他們利用該工具創建了一個基于Nova 2的內部模型,以改進其合規實踐。
可以將這視為超越了檢索增強生成技術的一步。AWS不僅僅是讓企業在其數據上進行推理查詢,而是真正將這些數據整合到模型訓練過程中,以創建定制模型。我們認為這有可能進一步推動Trainium的采用,因為Trainium就是為處理此類微調工作負載而設計的。
除了模型更新,亞馬遜還推出了新的Frontier Agents。你可以在這里閱讀更多相關信息,以及圍繞該公司AI快速進展引發的爭議。
應對技術債務
AWS也在利用智能體AI的力量來應對技術債務。AWS Transform正在獲得一套新的智能體AI工具集,旨在加速舊有企業代碼和應用程序的現代化改造,并且能夠跨任何API、框架、架構或語言工作。
考慮到阻礙AI應用的技術債務規模驚人,這顯然是一件大事。正如Garman在臺上指出的,埃森哲估計技術債務每年給美國企業造成總計2.4萬億美元的損失,而高德納咨詢公司發現70%的IT預算被遺留系統消耗。
事實上,AWS并非唯一致力于解決此問題的公司。微軟在五月份通過GitHub CoPilot推出了AI驅動的應用程序現代化功能。
值得注意的是,AWS特別瞄準了Windows現代化,宣稱其智能體是一種快速簡便的方法,可以將.NET應用程序、SQL Server和舊版用戶界面升級到不受許可協議約束的開源替代方案。還有用于大型機和VMware遷移的新智能體。
Chua告訴Fierce,這些新工具可能有助于加速云遷移,并最終“為AI/其他投資釋放資源”。他補充說,電信運營商甚至可能受益,或許能夠利用這些工具來改造“諸如計費和OSS/BSS等已有數十年歷史的核心系統”。
原文:https://www.fierce-network.com/cloud/heres-what-we-think-aws-big-reinvent-news