隨著球科技巨頭陸續(xù)入局AI大模型,算力需求(特別是大模型和行業(yè)應用等方面)迅速增長,GPU被全球哄搶,漲價、缺貨不斷。不過,也因此帶火了英偉達在三月份提出的一項業(yè)務——算力租賃。
據悉,GPU不像消費顯卡,很多商家會有庫存,本身存貨就很少,整個供應鏈上的貨不超過三四千片,ChatGPT熱度起來以后,存貨很快被互聯(lián)網大廠鎖定,今年3月后市場上基本沒有存貨。部分大廠直接從國外渠道找一些貨回來,如今50%以上的訂單基本都是互聯(lián)網大廠的。
GPU的火爆不僅在現貨市場,連訂單都在搶著下。
【資料圖】
上海六尺科技集團創(chuàng)始人張亞洲表示:“微軟、英特爾等海外大廠一邊自研、一邊也在對外采購,前期訂的一部分(GPU訂單),可能用于大規(guī)模訓練,但對于推理還是不夠。如今基本上廠商低于一個億的訂單,也許渠道商都不愿搭理,發(fā)郵件都不回?!?/p>
價格方面,多款GPU價格從3、4月到至今漲幅接近50%。4月份訂單還能排到10月份,如今已排到明年上半年。
價格暴漲,訂單延后,那對于迫切需要GPU來訓練模型的企業(yè),是否還有其他選擇?在這一背景下,也帶火了更具性價比的模式——算力租賃
算力租賃,顧名思義就是對算力進行出租,是一種通過云計算服務提供商租用計算資源的模式,適用于各種大規(guī)模計算需求的場景。企業(yè)用戶可以根據自己的需求租賃服務器或虛擬機實現大規(guī)模的計算任務,而無需擁有自己的計算資源。
其優(yōu)勢包括:無需投入大量資金購買計算設備、高效穩(wěn)定的計算服務、靈活的擴容或縮減,更好地滿足用戶的需求、非常靈活的計費方式,可以根據實際使用情況進行計費。
通過租賃計算資源,用戶可以快速地啟動項目,使用穩(wěn)定高效的計算資源,大大縮短了研發(fā)周期和成本。
有數據顯示,ChatGPT需要7-8個算力500P的數據中心才能支撐運行。對于微軟、谷歌、百度這樣的巨頭而言,算力成本顯然并不會成為障礙,但對于中小團隊來說,如此巨大的成本幾乎就是一座不可逾越的大山,并不是每一家企業(yè)都有能力建設屬于自己的算力矩陣。
因此,英偉達就提出了算力租賃的模式。
今年3月,英偉達CEO宣布了DGX Cloud算力租賃服務計劃,讓企業(yè)用戶不需購買昂貴的AI服務器,就能在云端上使用其提供的運算能力。企業(yè)用戶可以使用DGX運算資源來進行生成式AI或應用開發(fā)。
據悉,DGX是英偉達推出的AI超級電腦運算系統(tǒng),此次新推出的DGX Cloud算力租賃服務是英偉達與甲骨文等合作伙伴共同打造的。
至于DGX Cloud服務的訂閱收費,未來將按照每個實例/每個執(zhí)行個體來計算,每月收費36999美元起。每個實例包括8個NVIDIA H100或A100Tensor核心GPU,每個GPU節(jié)點內存高達640GB,實現計算資源專用,不和云中另外的租戶共享。
此外,DGX Cloud本身也支持英偉達自家的AI軟件和開發(fā)工具,比如Nvidia AI Enterprise提供端到端的AI框架與預訓練模型。
華福證券表示,國內具備研發(fā)及訓練大模型實力的企業(yè)較少,隨著行業(yè)的充分競爭,未來只會剩下1-2家大模型,采購服務器建設數據中心的重資產模式將產生大量的算力冗余,以公有云方式部署的算力租賃將是最優(yōu)解。
從算力租賃廠商前期布局的成本來看,核心成本主要集中在服務器研發(fā)和采購、維護和升級等方面,可通過特定的技術和管理手段來控制,如通過智能化管理降低管理成本、與芯片廠商進行戰(zhàn)略合作降低采購成本等。前期成本情況因公司規(guī)模不同而有所差異,大型廠商通常采用集中采購和規(guī)模效應來降低成本,而小型廠商則主要通過定制化方案來滿足客戶需求。
而站在用戶角度,基于算力租賃,用戶只要按需付費,不用承擔硬件設備的采購、維護、升級等費用,也不用擔心設備閑置或者過時造成浪費;用戶可隨時隨地通過云端訪問所需的算力資源,快速開始訓練和應用;用戶可根據需求選擇不同算力平臺和機型,也可以不受地域或者時間的限制模型、工具等資源,進行更多的嘗試和探索。
隨著大模型以及相關應用的發(fā)展,算力需求呈現爆發(fā)式增長。但除了大型互聯(lián)網企業(yè)、AI龍頭企業(yè)具有較多的GPU算力芯片儲備外,中小企業(yè)在發(fā)展AI模型、應用過程中,算力租賃或能成為廣大中小企業(yè)解決算力需求的選擇之一。
注:部分信息參考科創(chuàng)板日報、財聯(lián)社、第一財經等,圖源網絡,本號文章僅供學習和交流之用,不構成任何建議,不代表本號立場,如有任何問題,敬請聯(lián)系我們,謝謝。
標簽: