6月28日,通信互聯(lián)盛會MWC(世界移動通信大會)上海在上海新國際博覽中心開幕,這也是MWC上海十周年。
除了5G以及5G演進等移動通信技術趨勢外,當下人工智能、AIGC大模型是行業(yè)關注熱點也在展會得到了體現(xiàn),這些應用都需要強大算力底座。本屆MWC云集了聯(lián)想集團、新華三、中國信科等廠商,他們推出了搭載英偉達GPU的AI高端服務器,華為鯤鵬、海光、飛騰等本土芯片的產(chǎn)品也在不斷豐富。
今年以來,以ChatGPT為首的生成式AI被認為是人工智能領域的重大突破和方向。但千億級參數(shù)的大模型又需要強大的算力基礎設施來提供支持。AI算力緊缺,尤其英偉達芯片供應成為各界都在關注的話題。
(資料圖片)
聯(lián)想集團展臺上在重點位置展出了搭載了英偉達A800芯片的高端服務器,這臺能插八張GPU的服務器只插了兩張。
“這個挺貴的,一張需要10萬左右,所以我們只插了兩張。一臺服務器得賣100多萬元?!甭?lián)想展臺上一位工作人員介紹,目前這款服務器供應還是非常緊張,現(xiàn)在下單需要10個月左右才能有貨。
據(jù)了解,這款名為聯(lián)想SR670V2的AI服務器主要提供給大模型廠商使用。
在打造算力底座方面,聯(lián)想展出了AI服務器、分布式存儲、高性能計算等智能基礎設施。在分布式存儲展臺,聯(lián)想工作人員介紹稱,聯(lián)想對本土CPU芯片海光、飛騰都有支持,也推出了存儲產(chǎn)品。
新華三的展臺展出了一臺搭載英偉達H800高端芯片的高端服務器,這臺插了八張H800芯片的服務器售價高達200萬以上。
新華三集團副總裁、運營商事業(yè)部總經(jīng)理何寧接受澎湃新聞記者采訪也表示,搭載英偉達芯片的高端服務器供應還是非常緊張的,供貨周期在30周左右。
不過,何寧也表示,算力從近期供應上確實比較緊張,但從長遠來看算力肯定是過剩的,國內(nèi)的寒武紀、昇騰這些GPU廠商能力上來后,算力會處于供過于求的狀態(tài),到時候國內(nèi)市場肯定養(yǎng)不活這些廠商,需要向海外市場擴展。
一方面AI服務器缺貨,另一方面?zhèn)鹘y(tǒng)服務器需求下滑,這使得一些服務器廠商的業(yè)績受到影響。
日前,浪潮信息(000977)公告,受通用服務器客戶需求節(jié)奏變化、全球GPU及相關專用芯片供應緊張等因素的影響,公司半年度經(jīng)營業(yè)績較上年同期存在下降的風險。
上述聯(lián)想展臺工作人員表示,對購買服務器的企業(yè)用戶來講,今年投資重點用來買了AI服務器了,傳統(tǒng)的服務器基本上就暫停更換了,需要等一等。
不過,新華三展臺的一位產(chǎn)品經(jīng)理則表示,傳統(tǒng)服務器需求不是暫停而是需求減少了,像一些互聯(lián)網(wǎng)大廠由于自身業(yè)務的調(diào)整,對傳統(tǒng)服務器需求在下滑,這部分需求未來不一定會回來。
與此同時,本土算力產(chǎn)品正在逐漸豐富。華為在展臺展出了鯤鵬生態(tài)合作伙伴多款服務器整機,包括寶德、長虹、新華三等。鯤鵬是華為基于ARM架構開發(fā)的服務器芯片。此外,華為昇騰芯片計算平臺也展出了中心訓練芯片、中心推理芯片和邊緣推理芯片。
聯(lián)想和新華三的工作人員均表示,近年國產(chǎn)芯片的服務器、存儲等產(chǎn)品需求穩(wěn)定增長,政務、金融等對信息安全比較高的行業(yè)尤其明顯。
一家服務于運營商的軟件和信息服務廠商技術人士對澎湃新聞記者表示,東數(shù)西算在全國布局了多個數(shù)據(jù)節(jié)點,從算力上應該是夠了,如何調(diào)度使用好才是關鍵。
“比如說你用電,你不會想去了解這是水電還是風電,還是太陽能,但我們算力現(xiàn)在大家還會去了解這是什么哪家的產(chǎn)品,用什么架構?未來算力也會這樣,你在什么位置,需要多大算力,系統(tǒng)里自動給你最經(jīng)濟的配置方案,這需要超強的感知能力,比如有些科研機構的算力,相當長時間是閑置的,這些算力聯(lián)網(wǎng)后可以提供出來給大家用。這些工作在某些區(qū)域或者某些細分領域開始嘗試去做?!边@位廠商人士說道。
標簽: