本文來(lái)源:品玩
【資料圖】
在所有嫉妒$英偉達(dá)(NVDA.US)$大賺特賺的科技大廠里,$美國(guó)超微公司(AMD.US)$肯定是最憋屈的一個(gè)。
他們是常年相愛(ài)相殺的老對(duì)手。熟悉PC電腦市場(chǎng)的人都知道,一直以來(lái)英偉達(dá)RTX系列顯卡的主要對(duì)手就是AMD Radeon系列顯卡。
在最新的幾次顯卡迭代中,英偉達(dá)憑借光線追蹤和DLSS(深度學(xué)習(xí)超級(jí)采樣)等獨(dú)家技術(shù)拉開(kāi)了和AMD的差距,在消費(fèi)級(jí)市場(chǎng)占據(jù)優(yōu)勢(shì)。
這種情況在數(shù)據(jù)中心領(lǐng)域被復(fù)制。本來(lái),AMD的數(shù)據(jù)中心業(yè)務(wù)稱(chēng)得上可圈可點(diǎn),歐洲速度最快的超級(jí)計(jì)算機(jī)LUMI和美國(guó)橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室的Frontier超級(jí)計(jì)算機(jī)使用的都是AMD的處理器與加速器。
但由于半導(dǎo)體周期和全球經(jīng)濟(jì)疲軟等各種因素影響,2023財(cái)年第一季度,AMD數(shù)據(jù)中心的營(yíng)收是13億美元,按年同比沒(méi)有增長(zhǎng),與之形成鮮明對(duì)比的是英偉達(dá)數(shù)據(jù)中心業(yè)務(wù)營(yíng)收達(dá)42億,更恐怖的是其預(yù)計(jì)的第二季度的營(yíng)收將達(dá)到100億。
當(dāng)然你也不能全怪AMD,實(shí)際上英偉達(dá)一騎絕塵于所有芯片廠商,目前它的市值是AMD的五倍還多(一個(gè)有趣或諷刺的事實(shí)是,AMD的市值高于英特爾)。
因?yàn)橛サ腉PU被普遍認(rèn)為是大模型LLM訓(xùn)練與推理所必不可少的“關(guān)鍵基礎(chǔ)設(shè)施”,在生成式AI爆發(fā)的大背景下,算力成為了新的石油,每個(gè)人都在竭盡全力地爭(zhēng)奪。
AMD現(xiàn)在想要改變?nèi)藗冞@一固有看法。
6月13日,AMD在一場(chǎng)名為AMD數(shù)據(jù)中心和技術(shù)首映的發(fā)布會(huì)上公布了一系列新技術(shù)和產(chǎn)品。從這個(gè)名字我們就能看出來(lái),AMD聚焦的非常精準(zhǔn),就是數(shù)據(jù)中心產(chǎn)品。
最吸引人的是名為MI300X的GPU,它直接對(duì)標(biāo)了英偉達(dá)的H100——目前最先進(jìn)的GPU,訓(xùn)練大模型必不可少的基礎(chǔ)設(shè)施。
MI300X有高達(dá)192GB內(nèi)存,提供5.2TB的帶寬,AMD宣稱(chēng)相比上一代使用CDNA 2 架構(gòu)的 MI250 提高了8倍性能和5倍效率。而MI300X內(nèi)存不論密度還是容量都高于英偉達(dá)H100。
由于內(nèi)存巨大,大規(guī)模神經(jīng)網(wǎng)絡(luò)甚至不需要借助外部帶寬來(lái)傳輸數(shù)據(jù),僅在芯片內(nèi)部就能實(shí)現(xiàn)運(yùn)行。蘇姿豐Lisa Su——AMD的強(qiáng)人CEO,中文世界昵稱(chēng)蘇媽?zhuān)θ轁M面的宣稱(chēng)單個(gè)MI300X就能運(yùn)行800億參數(shù)的大模型。
AMD第一款超級(jí)芯片誕生了。
與超級(jí)芯片相伴的自然是超級(jí)計(jì)算機(jī),英偉達(dá)有DGX,AMD則推出了名為 Instinct(直覺(jué))的計(jì)算平臺(tái)。它由八個(gè)MI300X組成,因此擁有高達(dá)1.5TB的HBM3內(nèi)存。
除了MI300X外,這個(gè)系列還有一款早先已經(jīng)發(fā)布的MI300A,它不是純GPU而是APU,即在一顆芯片上同時(shí)集合了CPU和GPU,晶體管數(shù)量較MI300X略少,為1460億個(gè),針對(duì)的也是數(shù)據(jù)中心市場(chǎng)。
縱觀MI300系列產(chǎn)品,目標(biāo)可謂十分精準(zhǔn)——一切為了大模型。蘇姿豐預(yù)計(jì)到2027年AI芯片市場(chǎng)將達(dá)到1500億美元規(guī)模,這意味著它的復(fù)合年增長(zhǎng)率超過(guò)50%——在全球經(jīng)濟(jì)緩慢復(fù)蘇的大背景下,這顯然是個(gè)讓人垂涎的巨大市場(chǎng)。
理工科出身,從小就被譽(yù)為神童的蘇姿豐發(fā)布產(chǎn)品時(shí)往往給人一種“堆料”的感覺(jué)——具體好不好用先不說(shuō),咱的誠(chéng)意先擺在這里了。
蘇媽靠這種“誠(chéng)意”,幾乎一己之力將AMD從10年前的糟糕境地中拉了出來(lái),當(dāng)時(shí)AMD的股價(jià)長(zhǎng)期在個(gè)位數(shù)。MI300系列同樣給人這種感覺(jué),關(guān)鍵數(shù)據(jù)指標(biāo)上十分“頂”——內(nèi)存更大意味著單個(gè)GPU提供了更強(qiáng)的性能,這實(shí)際上等同于降低成本。
然而發(fā)布會(huì)舉行的當(dāng)天,AMD的股價(jià)應(yīng)聲下跌超過(guò)3%,而英偉達(dá)市值第二次超過(guò)萬(wàn)億美元。
這是為什么?
什么東西比硬實(shí)力更重要?時(shí)間。
市場(chǎng)對(duì)于AMD反應(yīng)不佳的原因歸納起來(lái)有兩點(diǎn),都和時(shí)間有點(diǎn)關(guān)系。
其一是,MI300X在第三季度才能提供樣品,第四季度才正式生產(chǎn),那么伴隨工藝磨合與產(chǎn)能爬坡等一系列問(wèn)題的逐步解決,大批量出貨不會(huì)早于2024年中,相比之下,英偉達(dá)H100是2022年10月上市的,也就是說(shuō)AMD比它的競(jìng)品晚了至少18個(gè)月才進(jìn)入市場(chǎng),這對(duì)任何領(lǐng)域的后發(fā)者都不是一個(gè)好消息,更不用說(shuō)一日千里進(jìn)步的AI加速器市場(chǎng)了,何況AMD面對(duì)的還是在該領(lǐng)域占據(jù)近60%份額的巨無(wú)霸。
第二是有關(guān)英偉達(dá)的先發(fā)優(yōu)勢(shì),這種優(yōu)勢(shì)不僅在于英偉達(dá)更早、更大規(guī)模地進(jìn)入并行計(jì)算領(lǐng)域,更在于它已經(jīng)為之打造了一個(gè)軟硬件一體協(xié)調(diào)的生態(tài)——人們使用CUDA軟件充分發(fā)揮英偉達(dá)GPU的性能,而CUDA生態(tài)連接著開(kāi)發(fā)者和AI生態(tài)產(chǎn)業(yè)鏈上下游——平臺(tái)生態(tài)成為一條寬而深的護(hù)城河。硬件遷移或許是容易的,但核心技術(shù)、代碼、開(kāi)發(fā)環(huán)境的整體搬遷則要傷筋動(dòng)骨得多。
AMD有什么理由說(shuō)服別人轉(zhuǎn)換到Instinct平臺(tái)?實(shí)際上在6月13日的這場(chǎng)發(fā)布會(huì)上,AMD沒(méi)有公布MI300X的任何客戶(hù),相比之下英偉達(dá)6月2號(hào)在COMPUTEX發(fā)布DGX GH200 超級(jí)計(jì)算機(jī)的同時(shí)就介紹了三個(gè)已經(jīng)下單的大客戶(hù):谷歌云、Meta和微軟。每一個(gè)都如雷貫耳。
除了時(shí)間之外,一些對(duì)技術(shù)路線的討論也給AMD的“硬實(shí)力”蒙上了一層陰影,比如192GB的大內(nèi)存。
由于采用了更適合AI計(jì)算的HBM3,而不是DDR5內(nèi)存規(guī)格,MI300X面臨著兩個(gè)問(wèn)題,第一它的售價(jià)不會(huì)太便宜,因?yàn)镠BM3工藝復(fù)雜成本高昂,而如果MI300X的售價(jià)(AMD還沒(méi)有公布任何價(jià)格信息)哪怕接近H100,都會(huì)讓它的吸引力大打折扣。
第二,采用HBM3內(nèi)存并不是AMD的獨(dú)家發(fā)明,而是業(yè)界通行做法。英偉達(dá)Grace Hopper 超級(jí)芯片里的GPU同樣使用了HBM3內(nèi)存(96GB),因此它無(wú)法構(gòu)成顯著的技術(shù)護(hù)城河——甚至,超越的方法都不限于一種。比如英偉達(dá)的NVLink技術(shù)可以在幾乎無(wú)損的情況下串聯(lián)256個(gè)Grace Hopper 超級(jí)芯片,這讓超級(jí)計(jì)算機(jī)的內(nèi)存容量高達(dá)144TB。
AMD自己不會(huì)不知道這些問(wèn)題,特別是英偉達(dá)CUDA護(hù)城河,想要突破這種時(shí)間積累起來(lái)的優(yōu)勢(shì),非得想一些絕招不可。
其實(shí)AMD有自己類(lèi)似CUDA的GPU生態(tài)軟件系統(tǒng),名叫ROCm,但一直以來(lái)都存在諸多缺點(diǎn),比如操作系統(tǒng)長(zhǎng)期只支持Linux,一度只適配高端顯卡等等,加上參加革命比較晚,讓ROCm始終無(wú)法穩(wěn)定構(gòu)建一個(gè)強(qiáng)大的開(kāi)發(fā)生態(tài)——相比之下CUDA有超過(guò)400萬(wàn)以上的開(kāi)發(fā)者。
于是AMD想到了合作。在發(fā)布會(huì)上AMD公布了兩項(xiàng)合作,一個(gè)是PyTorch基金會(huì),這讓ROCm(也就是AMD芯片)能夠全面支持PyTorch 2.0。
另一個(gè)合作對(duì)象則是人工智能初創(chuàng)公司Hugging Face。雙方的合作將確保AMD的硬件針對(duì)Hugging Face的模型進(jìn)行優(yōu)化,以充分發(fā)揮像MI300X這種硬件的潛力。AMD宣稱(chēng)在初步的測(cè)試中,MI250在BERT-Large訓(xùn)練上比競(jìng)品快了1.2倍,而GPT2-Large訓(xùn)練上則快了1.4倍。
這種合作對(duì)吸引開(kāi)發(fā)者和客戶(hù)轉(zhuǎn)投AMD平臺(tái)有一定的吸引力。Hugging Face是一個(gè)主張開(kāi)源的模型服務(wù)提供商,平臺(tái)上托管了數(shù)以萬(wàn)計(jì)的預(yù)訓(xùn)練模型和數(shù)據(jù)集,許多企業(yè)正在利用這個(gè)平臺(tái)構(gòu)建、訓(xùn)練和部署自己的AI模型。
這恰好能補(bǔ)上AMD在平臺(tái)生態(tài)上的短板,因?yàn)镽OCm實(shí)際上也是基于開(kāi)源項(xiàng)目編寫(xiě)的,它不限定編程技術(shù),框架上除了支持PyTorch外,還有Tensorflow,甚至通過(guò)HIP,ROCm能夠?qū)崿F(xiàn)對(duì)CUDA的完全兼容。與Hugging Face的合作將讓ROCm與其開(kāi)源庫(kù)無(wú)縫集成,也就是說(shuō)Hugging Face的模型在AMD芯片上能夠做到開(kāi)箱即用而不需要開(kāi)發(fā)者復(fù)雜的調(diào)試。
Hugging Face已經(jīng)在官網(wǎng)表示,Transformer架構(gòu)和生成式AI模型都將得到這種支持,這顯然將促進(jìn)AMD的生態(tài)繁榮,意味著很快我們將能看到基于AMD芯片原生訓(xùn)練的大模型。
Hugging Face是目前十分活躍的人工智能領(lǐng)域獨(dú)角獸企業(yè),模型托管服務(wù)和開(kāi)源特性讓它成為了許多大廠的合作伙伴。
僅僅今年上半年,Hugging Face就宣布了與亞馬遜云和IBM的合作,還進(jìn)一步深化了和微軟Azure原本就有的緊密關(guān)系。
AMD只是Hugging Face一連串合作列表里最新一個(gè)而已。它的加入標(biāo)志著大模型和生成式AI的興起正在使云服務(wù)提供商和芯片提供商為開(kāi)發(fā)者提供更多基礎(chǔ)服務(wù)——不僅包括算力,也包括各種基礎(chǔ)模型的調(diào)用。
這正是AMD缺乏而Hugging Face具有顯著優(yōu)勢(shì)的領(lǐng)域。Hugging Face的口號(hào)之一是讓人工智能民主化,這也就意味著它從根本上反對(duì)任何對(duì)市場(chǎng)的壟斷和獨(dú)占行為,同AI產(chǎn)業(yè)的上下游緊密協(xié)作不僅有利于讓更多的人受益于最新的軟硬件技術(shù),還通過(guò)引入競(jìng)爭(zhēng)讓這些技術(shù)變得更具性?xún)r(jià)比——也就是所謂民主化了。
“開(kāi)源意味著可以自由地基于廣泛的軟硬件中構(gòu)建解決方案?!痹谂cAMD合作的博客文章最后如此說(shuō)到。
這顯然為AMD在AI領(lǐng)域的奮起直追創(chuàng)造了條件,因?yàn)椤懊裰骰钡牧硪环N說(shuō)法就是“生態(tài)繁榮”,而繁榮的生態(tài)構(gòu)建了英偉達(dá)最寬廣的護(hù)城河。
AMD還有機(jī)會(huì)。路透社曾在AMD發(fā)布會(huì)前后腳宣稱(chēng)亞馬遜云正在考慮使用AMD的最新產(chǎn)品,這讓AMD的股價(jià)應(yīng)聲而漲——因?yàn)榇蠹叶挤浅jP(guān)注英偉達(dá)潛在的替代選項(xiàng)。
實(shí)際上包括谷歌、Meta等在內(nèi)的云服務(wù)大廠都在打自研芯片的主意,為的就是不再白白給處于近乎壟斷地位的英偉達(dá)交“算力稅”,五月時(shí)甚至一度傳出微軟在和AMD展開(kāi)芯片領(lǐng)域合作。
大家這種不約而同的反應(yīng)恰恰反映了如今AI產(chǎn)業(yè)正處于一個(gè)激烈變革的時(shí)間節(jié)點(diǎn),它孕育著機(jī)會(huì)。對(duì)AMD來(lái)說(shuō)這一場(chǎng)戰(zhàn)役也不容有失:AI產(chǎn)業(yè)爆發(fā)的另一面是整個(gè)行業(yè)大環(huán)境的下行壓力進(jìn)一步加大,巨頭們投入GPU的預(yù)算越多,留給數(shù)據(jù)中心別的業(yè)務(wù)的錢(qián)就越少——而這在過(guò)去是AMD營(yíng)收的重要來(lái)源。
蘇姿豐把人工智能上升為AMD的“最高戰(zhàn)略?xún)?yōu)先級(jí)”,MI300X是她最新的得意之筆,但正如我們前面所分析的,硬實(shí)力之外AMD還需要有更巧的軟實(shí)力打法,才能在這場(chǎng)千載難逢、劇烈變動(dòng)卻又森嚴(yán)的競(jìng)爭(zhēng)版圖中為自己掙得應(yīng)有的地位。
2006年,AMD收購(gòu)ATI獲得了圖形處理技術(shù),由此展開(kāi)了和英偉達(dá)在GPU領(lǐng)域漫長(zhǎng)的競(jìng)爭(zhēng)?,F(xiàn)在,這場(chǎng)比賽正式進(jìn)入了名為“人工智能”的新賽季。
我們拭目以待。
編輯/Corrine
標(biāo)簽: