欧美成人A片免费|日韩无码一级av|一级黄色大片在线播放|黄片视频在线观看无码|亚洲精品成人无码影视|婷婷五月天视频网站|日韩三级AV在线播放|姓爱av在线婷婷春色五月天|真人全黃色录像免费特黄片|日本无码黄在线观看下载

  • +1

獨(dú)家|亞馬遜披露多年自研芯片歷程,與英偉達(dá)合作詳情

澎湃新聞?dòng)浾?邵文
2023-12-04 09:40
來源:澎湃新聞
? 未來2% >
字號(hào)

·AWS正與英偉達(dá)合作推動(dòng)Ceiba項(xiàng)目。英偉達(dá)將擁有自己的超級(jí)計(jì)算機(jī)供自己使用,并提供DGX云服務(wù)(訓(xùn)練即服務(wù))給他們的最終客戶,AWS也將為自己的客戶提供英偉達(dá)GH200 NVL32的多節(jié)點(diǎn)集群。

·對(duì)于Trainium 2及Graviton 4在中國(guó)市場(chǎng)的推出時(shí)間,AWS計(jì)算和網(wǎng)絡(luò)副總裁大衛(wèi)?布朗在接受澎湃科技采訪時(shí)表示還未有明確時(shí)間表。

在11月26日-12月1日期間舉辦的2023亞馬遜云科技re:Invent全球大會(huì)上,亞馬遜云科技(AWS)公布了其在硬件方面的諸多努力,推出了專為訓(xùn)練人工智能系統(tǒng)而設(shè)計(jì)的第二代芯片Trainium 2,以及通用Graviton 4處理器。英偉達(dá)CEO黃仁勛也到現(xiàn)場(chǎng)站臺(tái),宣布AWS成為第一家在云端配備英偉達(dá)最新GH200 Grace Hopper超級(jí)芯片的云廠商。

對(duì)于Trainium 2及Graviton 4在中國(guó)市場(chǎng)的推出時(shí)間,AWS計(jì)算和網(wǎng)絡(luò)副總裁大衛(wèi)?布朗(David Brown)在大會(huì)期間接受澎湃科技(m.xinlihui.cn)采訪時(shí)表示還未有明確時(shí)間表,“我不能100%確定時(shí)間。我們對(duì)所有實(shí)例的標(biāo)準(zhǔn)做法是,選擇全球的幾個(gè)地區(qū)首次推出,然后迅速查看其他可能推出的地區(qū),這個(gè)過程基于客戶需求和其他一些因素。在未來的幾個(gè)月內(nèi),我們將更清楚何時(shí)進(jìn)入中國(guó)市場(chǎng)?!?/p>

Amazon Graviton4 和Amazon Trainium(原型)。

在為期5天的會(huì)議期間,生成式人工智能幾乎是每場(chǎng)論壇都會(huì)提及的高頻詞匯,成本優(yōu)化則是相關(guān)熱門話題。在此期間,記者對(duì)話亞馬遜云科技數(shù)據(jù)庫(kù)、數(shù)據(jù)分析和機(jī)器學(xué)習(xí)全球副總裁斯瓦米·西瓦蘇布拉馬尼安(Swami Sivasubramanian)和大衛(wèi)?布朗,談及與英偉達(dá)的合作詳情,AWS自研芯片的發(fā)展過程,以及當(dāng)下對(duì)生成式人工智能發(fā)展熱潮的思考。

“成為運(yùn)行英偉達(dá)GPU的最佳場(chǎng)所”

“我們與英偉達(dá)密切合作了很長(zhǎng)時(shí)間,投入了大量資源,將最新的英偉達(dá)GPU引入AWS(亞馬遜云科技)?!辈祭时硎?,當(dāng)你運(yùn)行英偉達(dá)GPU時(shí),要做得好非常具有挑戰(zhàn)性?,F(xiàn)在正在發(fā)生的事情是,這些GPU變得非常復(fù)雜,從工程角度來看,運(yùn)行它們變得非常困難?!拔艺J(rèn)為AWS在如何運(yùn)行這些GPU方面確實(shí)勝過其他所有競(jìng)爭(zhēng)對(duì)手,我們也希望成為運(yùn)行英偉達(dá)GPU的最佳場(chǎng)所?!?/p>

黃仁勛在大會(huì)現(xiàn)場(chǎng)的對(duì)話中提到了一個(gè)他稱之為“驚人的”統(tǒng)計(jì)數(shù)據(jù):僅在過去幾年中,AWS在云中部署了200萬(wàn)個(gè)使用Ampere和Hopper架構(gòu)的GPU,這相當(dāng)于一個(gè)3000 EFLOPS(每秒進(jìn)行百億億次浮點(diǎn)運(yùn)算)運(yùn)算性能的超級(jí)計(jì)算機(jī)。

“擁有一臺(tái)百億億級(jí)次浮點(diǎn)運(yùn)算性能的超級(jí)計(jì)算機(jī)就非常令人羨慕,而AWS相當(dāng)于擁有3000臺(tái)這樣的超級(jí)計(jì)算機(jī)。”黃仁勛說,“這才只是一個(gè)開始。我們與AWS的合作仍在以驚人的速度增長(zhǎng)。每個(gè)季度,我們都會(huì)為AWS部署超過1 ZFLOPS(1 ZFLOPS=1000 EFLOPS)的計(jì)算能力,這是一個(gè)令人難以置信的數(shù)字,我們兩個(gè)團(tuán)隊(duì)建立了一整套新的基礎(chǔ)設(shè)施?!?/p>

與此同時(shí),AWS實(shí)際上一直在投資自己的定制芯片,從2013年推出首顆Nitro 1芯片至今,AWS是最先涉足自研芯片的云廠商,已擁有虛擬化芯片、服務(wù)器芯片、人工智能機(jī)器學(xué)習(xí)自研芯片3條產(chǎn)品線。

為何“雙管齊下”,一邊與英偉達(dá)合作更加緊密,一邊自研芯片?

布朗解釋稱,一切都是為了確??蛻粲羞x擇。“選擇是如此重要。它真的推動(dòng)了正向的客戶體驗(yàn),并且從長(zhǎng)遠(yuǎn)來看,這將帶來最好的結(jié)果,因?yàn)樗羞@些選擇都在獨(dú)立創(chuàng)新,彼此競(jìng)爭(zhēng)。在某些情況下,一些工作負(fù)載可能在Trainium上,而在其他情況下可能在英偉達(dá)上,所以最終可能不會(huì)有一個(gè)贏家,始終會(huì)有英偉達(dá)、Trainium和市場(chǎng)上的其他選擇。”

對(duì)于為何AWS有自研的Titan大模型,同時(shí)又投資OpenAI的競(jìng)爭(zhēng)對(duì)手Anthropic,在AWS平臺(tái)同時(shí)提供Claude 2大模型等選項(xiàng),西瓦蘇布拉馬尼安也給了相似的答案?!八鼈儗?shí)際上具有不同的能力,Claude 2具有非常好的推理能力,而Titan模型非常靈活,兩者在性能成本等方面也很不同。我認(rèn)為擁有更多的選擇從客戶角度來看是一件好事,這也是激勵(lì)我們的原因?!?/p>

AWS正與英偉達(dá)合作推動(dòng)Ceiba項(xiàng)目,計(jì)劃構(gòu)建全球最快的GPU驅(qū)動(dòng)的AI超級(jí)計(jì)算機(jī)——配置16384顆英偉達(dá)H200超級(jí)芯片,能處理65 EFLOPS速度等級(jí)的AI運(yùn)算,為英偉達(dá)研發(fā)團(tuán)隊(duì)提供服務(wù)。

對(duì)于記者詢問Ceiba項(xiàng)目是否只服務(wù)于英偉達(dá),布朗表示,英偉達(dá)將擁有自己的超級(jí)計(jì)算機(jī)供自己使用,并提供DGX云服務(wù)(訓(xùn)練即服務(wù),AI-training-as-a-service)給他們的最終客戶,AWS也將為自己的客戶提供英偉達(dá)GH200 NVL32的多節(jié)點(diǎn)集群。

“繼續(xù)成本優(yōu)化”

“我在這周進(jìn)行的對(duì)話實(shí)際上都關(guān)于如何繼續(xù)成本優(yōu)化。生成式人工智能如此新穎,大家都在努力弄清楚如何在業(yè)務(wù)中應(yīng)用它,但有兩件事必須考慮清楚?!辈祭收f。

第一是構(gòu)建概念驗(yàn)證,真正測(cè)試生成式人工智能對(duì)業(yè)務(wù)的潛在影響。第二,當(dāng)企業(yè)擁有了生成式人工智能解決方案,必須確保它可以適應(yīng)企業(yè)的損益表。如果運(yùn)行成本過高,實(shí)際上無法部署,因?yàn)樗鼘]有用處。布朗表示,“無論是通過開發(fā)模型還是Trainium芯片這樣的方式,我們都希望真正降低生成式人工智能所需的成本。”

西瓦蘇布拉馬尼安也在對(duì)話中表示,企業(yè)需要的不僅僅是更大的模型,更關(guān)鍵的是投資回報(bào)?!氨热缥艺跇?gòu)建生成式人工智能應(yīng)用程序,希望增加收入或降低成本,但我不想在推理上花費(fèi)巨額資金,因?yàn)檫@意味著我可能無法產(chǎn)生盈利。當(dāng)我們與這些企業(yè)合作時(shí),他們會(huì)意識(shí)到其實(shí)際上需要的是一個(gè)較小的模型以適應(yīng)特定用例,這樣就可以在不使用大型模型的情況下從生成式人工智能中獲得價(jià)值。他們實(shí)際上從一個(gè)非常龐大的模型過渡到了經(jīng)過精細(xì)調(diào)整的較小模型,并取得了更低的成本、更高的準(zhǔn)確性和更好的性能?!?/p>

在回顧AWS從2013年推出Nitro芯片的歷程時(shí),被高頻提及的也是成本優(yōu)化?!澳柖桑ㄗⅲ耗柖芍讣呻娐飞峡扇菁{的晶體管數(shù)目,約每隔18-24個(gè)月便會(huì)增加一倍,性能也將提升一倍。)早在十幾年前就有所減弱,就像人們說的,我們不可能讓這些芯片再快一點(diǎn)了,因?yàn)槿绻偬砑痈嗟木w管,就無法保持冷卻效果,這是一個(gè)物理問題。我們正處于這樣一個(gè)旅程中,我們需要思考,如何持續(xù)提高性能、降低成本?”布朗表示,“除非我們真的涉足芯片并在硬件上進(jìn)行創(chuàng)新,否則我們所能做的事情就會(huì)受到限制,我們不能僅僅依賴于行業(yè)中現(xiàn)有的東西。因此,我們首先從Nitro開始這個(gè)旅程。”

布朗繼續(xù)分享道,“然后我們想,是否真的可以構(gòu)建一款服務(wù)器芯片?這個(gè)想法是,我們可以構(gòu)建一款基于Arm架構(gòu)的芯片。Arm架構(gòu)就在每個(gè)人的手機(jī)上,它的功耗很低,因?yàn)槠湔麄€(gè)芯片的架構(gòu)都是為全天電池運(yùn)行而設(shè)計(jì),它還有一個(gè)強(qiáng)大的生態(tài)系統(tǒng),有很多為手機(jī)編寫的應(yīng)用程序。我們當(dāng)時(shí)認(rèn)為Arm架構(gòu)是我們構(gòu)建服務(wù)器芯片的完美選擇,這就是Graviton的由來?!?/p>

推理芯片Inferentia和訓(xùn)練芯片Trainium則可以追溯到5年前,當(dāng)時(shí)布朗團(tuán)隊(duì)認(rèn)為,機(jī)器學(xué)習(xí)中的絕大部分成本實(shí)際上是推理,如果能夠構(gòu)建一個(gè)推理芯片并降低推理成本,客戶就可以完成更多推理并改進(jìn)應(yīng)用程序,訓(xùn)練方面也同樣?!艾F(xiàn)在由于生成式人工智能的原因,訓(xùn)練占主導(dǎo)地位,但隨著更多人使用生成式人工智能,推理的工作負(fù)載會(huì)在時(shí)間的推移中恢復(fù),Inferentia 2將非常適合這個(gè)用途?!辈祭收f。

目前這些工作已經(jīng)帶來了回報(bào),據(jù)布朗介紹,Graviton比當(dāng)時(shí)的可用產(chǎn)品計(jì)算性能提升了40%,Graviton 2比前一代提高了25%,Graviton 3比Graviton 2更優(yōu),現(xiàn)在Graviton 4至少比Graviton 3提高了30%。

從左至右依次為Graviton 1、Graviton 2、Graviton 3、Graviton 4。圖片來源:澎湃科技

“這就是我們?cè)贕raviton上看到的,我們正在改變芯片的架構(gòu)方式,改變簡(jiǎn)化芯片的方式,改變?yōu)樾酒峁╇娫吹姆绞?,同時(shí)還有許多可以提高性能的方法。因此,摩爾定律的消失并不意味著我們不再能通過創(chuàng)新和加速性能的方式來發(fā)展?!辈祭收f。

解決算力需求劇增帶來的環(huán)境問題

對(duì)于2024年生成式人工智能如何發(fā)展有何判斷?西瓦蘇布拉馬尼安對(duì)澎湃科技表示,這些模型將因其推理能力等的不斷提升而變得越來越強(qiáng)大,因此我們將會(huì)看到更多的應(yīng)用。

而隨著生成式人工智能應(yīng)用到各個(gè)領(lǐng)域,對(duì)算力的需求也會(huì)進(jìn)一步劇增,如何解決高算力帶來的能源消耗與環(huán)保問題?

據(jù)布朗透露,到2040年,亞馬遜公司整體將實(shí)現(xiàn)碳中和,但這包括貨車、飛機(jī)等,因此,在碳足跡方面,AWS將在2030年實(shí)現(xiàn)碳中和。

“這意味著我們?cè)跀?shù)據(jù)中心使用的電力將來自綠色能源,如風(fēng)、水、太陽(yáng)能,或者如果我們必須消耗不來自綠色能源的電力,我們將購(gòu)買碳抵消來確保該電力從碳中和的角度來看是綠色的。我們正在按計(jì)劃實(shí)現(xiàn)2030年的碳中和目標(biāo),到2025年,我們實(shí)際上產(chǎn)生的清潔水將比消耗的更多?!辈祭收f。

那么在芯片方面如何更加節(jié)能?布朗說,“最好的辦法就是不使用電力。因此,使用Graviton會(huì)比同類芯片少用60%的電來完成相同的工作負(fù)載,這意味著在我們工作負(fù)載上所用的能量要比在其他云服務(wù)提供商上看到的要少得多。如果看Trainium 2,它實(shí)際上使用的能量比Trainium 1完成相同工作負(fù)載要少兩倍。”

布朗透露,英偉達(dá)也在關(guān)注這個(gè)問題,“我們也一直在與英特爾、AMD等交流,討論他們使用的功率?盡管對(duì)算力的需求正在以瘋狂的速度增長(zhǎng),但我們確實(shí)需要一個(gè)更加節(jié)能的世界,這是有限的資源?!?/p>

    責(zé)任編輯:鄭潔
    校對(duì):張亮亮
    澎湃新聞報(bào)料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2026 上海東方報(bào)業(yè)有限公司