撰文/ 牛跟尚
【資料圖】
編輯/ 張 南
設(shè)計(jì)/ 琚 佳
當(dāng)前,汽車領(lǐng)域科技革命和產(chǎn)業(yè)變革蓬勃興起,中國(guó)汽車行業(yè)站在了轉(zhuǎn)型升級(jí)的十字路口。
在后摩智能創(chuàng)始人兼CEO吳強(qiáng)看來,這幾年,中國(guó)電動(dòng)智能化的發(fā)展已經(jīng)走到了世界前列,這是一個(gè)難得的歷史機(jī)遇,中國(guó)企業(yè)應(yīng)該乘勢(shì)而上,抓住機(jī)遇,聯(lián)合產(chǎn)業(yè)鏈上下游,推動(dòng)智能駕駛繼續(xù)向前發(fā)展。
6月16日,這家高科技新創(chuàng)公司負(fù)責(zé)人在2023第十五屆中國(guó)汽車藍(lán)皮書論壇上說,發(fā)表題為“存算一體創(chuàng)新引擎,力破智能駕駛僵局”的演講。
他認(rèn)為,長(zhǎng)期來看,智能駕駛的漸進(jìn)式發(fā)展,會(huì)從L2+逐漸向L3、L4迭代、演進(jìn),L2+是智能駕駛必經(jīng)之路,但一定不是終點(diǎn),高階智能駕駛一定會(huì)來。
怎么才能打破目前的智能駕駛僵局?吳強(qiáng)認(rèn)為,第一,需要技術(shù)和算法上的突破;第二,需要數(shù)據(jù)的大量積累;第三,需要用芯片實(shí)現(xiàn)計(jì)算效率的階躍。只有這三個(gè)方面同時(shí)滿足,才有可能打破目前看到的僵局。
后摩智能要做的就是用創(chuàng)新的存算一體底層架構(gòu),打造高能效比的智駕芯片,實(shí)現(xiàn)計(jì)算效率數(shù)量級(jí)地提升。
自2020年成立以來,作為國(guó)內(nèi)率先采用存算一體技術(shù)打造智能駕駛計(jì)算芯片的硬科技企業(yè),后摩智能致力于突破芯片算力和功耗瓶頸。
2023年5月10日,后摩智能在上海發(fā)布首顆高性能、低功耗的存算一體智駕芯片——后摩鴻途H30。該芯片提供高達(dá)256TOPS的物理算力,為智能駕駛、泛機(jī)器人等邊緣場(chǎng)景提供強(qiáng)大的計(jì)算核心。
在算力需求蓬勃爆發(fā)的時(shí)代下,存算一體技術(shù)走過概念、走出實(shí)驗(yàn)室,開始走向量產(chǎn)及市場(chǎng)。它顛覆性地將芯片的計(jì)算單元與存儲(chǔ)單元融合,能夠從根本上解決54年前馮·諾伊曼架構(gòu)計(jì)算與存儲(chǔ)分離帶來的能效瓶頸。
吳強(qiáng)介紹,存算一體跟傳統(tǒng)的方式相比,它的計(jì)算效率可以實(shí)現(xiàn)一個(gè)數(shù)量級(jí)的提升。這種計(jì)算效率體現(xiàn)在算力、功耗、能效比、延時(shí)和成本等等方面。
作為創(chuàng)新力量的另一個(gè)方面,它對(duì)技術(shù)底線有保障。在當(dāng)下的國(guó)際環(huán)境中,基于存算一體自身的架構(gòu)特點(diǎn),它可以用相對(duì)落后的工藝制程,依然能做出媲美基于常規(guī)架構(gòu)用先進(jìn)制程做出來的芯片產(chǎn)品。
吳強(qiáng)打比方說,可用28nm的工藝做出一款算力和功耗媲美7nm常規(guī)架構(gòu)的芯片,這就是后摩爾時(shí)代底層架構(gòu)創(chuàng)新能夠帶來的價(jià)值。在今天的國(guó)際環(huán)境下,它能夠?yàn)閲?guó)產(chǎn)供應(yīng)鏈自主可控帶來一些特殊意義。
以下是后摩智能創(chuàng)始人兼CEO吳強(qiáng)的演講實(shí)錄,此處有刪節(jié)。
各位嘉賓、各位新老朋友:
大家好!我是后摩智能的吳強(qiáng)。
當(dāng)組委會(huì)找我選演講課題的時(shí)候,他們給了我一個(gè)清單,列了一些選擇的話題,我最后選了“智能駕駛僵局”這個(gè)話題。因?yàn)槲矣X得在過去幾年里邊對(duì)智能駕駛來說,我們經(jīng)歷了一個(gè)特別樂觀又到特別悲觀的這么一個(gè)過程。
今天。我想談?wù)勅绾斡么嫠阋惑w這樣一個(gè)創(chuàng)新的技術(shù),從芯片的角度來分析如何去打破智能駕駛這樣一個(gè)僵局。
智能駕駛的僵局
僵局主要體現(xiàn)在兩個(gè)方面。
一方面是,L4、L3這種高級(jí)智能駕駛落地沒有大家想象那么快。前幾年大家特別樂觀,覺得很快就可以落地,并且可以形成商業(yè)閉環(huán)。
但是大家后來發(fā)現(xiàn)其實(shí)沒有想象得那么快,這兩年突然間業(yè)內(nèi)出現(xiàn)很多聲音,說L3、L4也許十年二十年都不可能到來,我們一直L2+++,無限+下去。
另外一個(gè)方面體現(xiàn)在,用戶對(duì)L2+或者L2的價(jià)值認(rèn)同不強(qiáng)。大家覺得L2智能化是好,但是這個(gè)東西到底是不是一個(gè)噱頭,我有就可以了。至于我有了以后用不用,用得好不好可能我不在乎。所以大家覺得這個(gè)東西也許沒有那么多的價(jià)值,我也不愿意為它付很多的價(jià)錢,所以就開始了所謂的“價(jià)格戰(zhàn)”。
我最近一直思考的一個(gè)問題,智能駕駛真的沒有價(jià)值的嗎?L3、L4真的十年二十年都不可能到來嗎?我們用戶真的覺得L2+這個(gè)東西是一個(gè)雞肋,只是便宜就行了嗎?
這個(gè)問題我一直思考了很多。當(dāng)然業(yè)內(nèi)對(duì)這種觀點(diǎn)有人樂觀,有人悲觀,剛才唐銳總說的覺得十年二十年都不可能到來L3、L4,但也有人說2025年、2030年就可以到來。所以大家各有各的樂觀或者悲觀的預(yù)計(jì)。
我的想法是,如果拿不準(zhǔn)的時(shí)候會(huì)退一步從更深層、更底層的邏輯去做判斷,去看底層的邏輯和趨勢(shì)。
首先,智能化它本身是一個(gè)剛需,比如說我作為一個(gè)用戶來說,L2+最終對(duì)客戶產(chǎn)生價(jià)值并不是L2+,真正能把客戶解放出來的是L3、L4。所以從客戶的需求上來說,其實(shí)我們需要有這個(gè)剛需,大家需要從每天的駕駛中解放出來。
第二,從歷史的發(fā)展趨勢(shì)看,其實(shí)很多的這種智能化已經(jīng)成為了一個(gè)不可逆的浪潮,就像我們從蒸汽機(jī)到內(nèi)燃機(jī),從燃油車到電動(dòng)車,這個(gè)趨勢(shì)已經(jīng)在發(fā)生。
這幾年中國(guó)從電動(dòng)車智能化已經(jīng)走到了前列,這本身是一個(gè)難得歷史機(jī)遇,所以我們不應(yīng)該被暫時(shí)的這種困境、挫折困住,我們應(yīng)該乘勢(shì)而為,抓住這個(gè)歷史機(jī)遇,去推動(dòng)智能駕駛的發(fā)展。
這是我思考的一個(gè)過程。我的觀點(diǎn)是更樂觀的,從未來來看,L2+智能駕駛一定是一個(gè)漸進(jìn)的過程,它會(huì)從L2+逐漸向L3、L4去迭代、去演進(jìn),并且L2+是智能駕駛一個(gè)必經(jīng)之路,但是L2+一定不是終點(diǎn)。
怎么才能打破
需要幾個(gè)方面。第一,我們需要在技術(shù)和算法上突破。第二,我們需要在數(shù)據(jù)上的積累和突破。第三,我們需要從芯片、從算法有一些更深層的效率上的階躍。只有這三個(gè)方面同時(shí)滿足才有可能打破目前我們看到的僵局。
短期來看,我們要做的事情是盡快地讓L2量產(chǎn)普及。
這里面有兩個(gè)方面。第一方面,我們要讓更便宜的車都能用到L2+,有更多的車跑在路上收集更多的數(shù)據(jù)。第二方面,我們要用真正的能給客戶帶來價(jià)值的L2+,而不是讓大家覺得這就是一個(gè)噱頭,只是有而已。
我希望它能夠給客戶帶來實(shí)實(shí)在在的價(jià)值,盡管不能是完全替代,但是希望能帶來價(jià)值。
我們不單單需要高速NOA,我們需要環(huán)線,需要繞城,甚至最后能不能到城市NOA,這個(gè)我覺得是未來幾年里面我們希望各個(gè)同行們?cè)蹅円黄鹑ヅΦ氖虑椤?/p>
因?yàn)槲覀兪亲鲋悄荞{駛芯片的,對(duì)我們來說:第一,我們希望能夠提供更便宜、性價(jià)比更高的芯片。這里面包括一方面是說讓更多的車能夠付得起這個(gè)費(fèi)用;同時(shí),這不單單是價(jià)格問題,還有功耗能不能降到最低,我可以不用液冷,我用自然風(fēng)冷,我可以讓很便宜的車都能夠安裝得起這種不太復(fù)雜的智能駕駛系統(tǒng)。
我們的效率、算力要進(jìn)一步大幅度提升,真正能做到給客戶帶來真正價(jià)值的智能駕駛體驗(yàn),讓客戶感受到它是有實(shí)實(shí)在在的價(jià)值,提高這樣的認(rèn)同感,這可能是我們所有同行們可以在短期共同努力的方向,讓L2+真正量產(chǎn)普及。
隨著L2+的量產(chǎn)普及,我們會(huì)收集大量的數(shù)據(jù),積累大量的數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)的積累和突破。
如果說我們有些算法上的突破,比如說現(xiàn)在的大模型,它也給我們的算法突破提供了一個(gè)非常有前途的方向。
其實(shí)就是我們算力、芯片。算力芯片如果到L4這個(gè)級(jí)別,長(zhǎng)期來說我們的目標(biāo)是向L4,這才是真正的終極的目標(biāo),真正把人類從繁重的駕駛中解脫出來。這種情況下,我們需要的算力和效率提升不是一個(gè)簡(jiǎn)單的提升,其實(shí)是希望一個(gè)數(shù)量級(jí)的階躍,才能真正達(dá)到L4這樣一個(gè)級(jí)別。
對(duì)我們來說,這是一個(gè)非常挑戰(zhàn)的目標(biāo),我相信這個(gè)事情不是遙不可及。
如何才能實(shí)現(xiàn)數(shù)量級(jí)的計(jì)算效率提升
它不是一個(gè)簡(jiǎn)單的改良就能做到,我們需要更多的一些在底層架構(gòu)上的創(chuàng)新。
特別是隨著摩爾定律逼近極限,其實(shí)我們需要一些更契合后摩爾時(shí)代的這種底層架構(gòu)創(chuàng)新,才能實(shí)現(xiàn)我們說的數(shù)量級(jí)的效率提升。
存算一體式后摩爾時(shí)代的新技術(shù)之一,它的基本原理是說,我們?cè)贏I的計(jì)算當(dāng)中,打破傳統(tǒng)的馮·諾依曼架構(gòu),不再用計(jì)算和存儲(chǔ)分開的方式,而是把計(jì)算和存儲(chǔ)完全融合的方式,去實(shí)現(xiàn)計(jì)算效率數(shù)量級(jí)地提升,這是一種計(jì)算底層架構(gòu)的重構(gòu)。
存算一體的創(chuàng)新力量,它體現(xiàn)在兩個(gè)方面。
一方面是說它的技術(shù)上限特別高。存算一體跟傳統(tǒng)的方式相比,它的計(jì)算效率可以實(shí)現(xiàn)一個(gè)數(shù)量級(jí)的提升。這種計(jì)算效率體現(xiàn)在算力、功耗、能效比、延時(shí)和成本等等方面。
作為創(chuàng)新力量的另外一個(gè)方面,是技術(shù)底線有保障。在當(dāng)下的國(guó)際環(huán)境中,基于存算一體自身的架構(gòu)特點(diǎn),它可以用相對(duì)落后的工藝制程,依然能做出媲美基于常規(guī)架構(gòu)用先進(jìn)制程做出來的芯片產(chǎn)品。
打個(gè)比方說,我們?cè)?jīng)用28nm的工藝做出了一款算力和功耗可以媲美7nm常規(guī)架構(gòu)的芯片,這個(gè)本身就是后摩爾時(shí)代底層架構(gòu)創(chuàng)新能夠帶來的價(jià)值。在今天的國(guó)際環(huán)境下,它能夠?yàn)閲?guó)產(chǎn)供應(yīng)鏈自主可控帶來一些特殊的作用。
后摩是一家成立時(shí)間不長(zhǎng)的公司,但是我們是國(guó)內(nèi)最早用存算一體做大算力AI芯片的公司,今年5月份我們發(fā)布了首款量產(chǎn)的存算一體智駕芯片——鴻途H30。
簡(jiǎn)單說一下它的規(guī)格, 鴻途H30 AI算力最高可以達(dá)到256TOPS,這是物理算力,不是虛擬算力,但它的典型功耗只有在35瓦左右。這樣的效率,跟市場(chǎng)上面國(guó)際巨頭254TOPS虛擬算力的芯片比,我們的性能大概是它的2倍。所以我們AI性能是它的2倍,但我們功耗只有它的1/2,這里面大概有幾倍效率的提升。
這個(gè)效率提升來源于兩個(gè)方面,一方面是我們底層核心IP完全自研,后摩創(chuàng)新自研了量產(chǎn)級(jí)的存算一體IP,只有這種存算一體的技術(shù),才能達(dá)到幾倍的AI計(jì)算效率的提升,常規(guī)架構(gòu)其實(shí)很難做到。我們應(yīng)該是國(guó)內(nèi)存算一體大算力IP方面走得最前面的。
另外就是我們自研的IPU,基于存算一體的底層架構(gòu),為AI計(jì)算設(shè)計(jì)的IPU。
鴻途H30芯片是基于我們第一代的天樞架構(gòu),我們也正在研發(fā)第二代的天璇架構(gòu),天璇架構(gòu)增加了對(duì)Transformer等大模型更好的支持,為后續(xù)大模型的應(yīng)用遷移打基礎(chǔ)。
當(dāng)然我們后面還有第三代天璣架構(gòu)。我們完全自研的IPU架構(gòu)是我們能夠有如此高計(jì)算效率的另外一個(gè)原因。
天樞架構(gòu)采用多核、多硬件線程的方式擴(kuò)展算力,實(shí)現(xiàn)了計(jì)算效率與算力靈活擴(kuò)展的完美均衡,AI 計(jì)算可以在核內(nèi)完成端到端處理,保證通用性。
這是我們第一代芯片鴻途H30性能的測(cè)試,這是實(shí)測(cè)的結(jié)果,對(duì)一些比較典型的網(wǎng)絡(luò),我們和一個(gè)國(guó)際巨頭的數(shù)據(jù)做了比較,鴻途H30基于Resnet 50 模型的 Benchmark,在Batch Size等于1和8的條件下分別達(dá)到了8700 幀/秒和 10300 幀/秒的性能。
從能效比的角度,我們的芯片實(shí)現(xiàn)了性能2倍提升的同時(shí),還降低了50% 功耗,所以我們?cè)谛史矫娲蟾攀怯?倍以上的提升。這些都是得益于存算一體這個(gè)創(chuàng)新架構(gòu)帶來的一些價(jià)值。
鴻途H30是針對(duì)智能駕駛而設(shè)計(jì)的芯片,我們基于最新的智能駕駛的一些算法和網(wǎng)絡(luò)做了適配,包括BEV模型、PointPillar網(wǎng)絡(luò)模型 ,用鴻途H30 打造的智能駕駛解決方案已經(jīng)在合作伙伴的無人小車上完成部署。
芯片之外,我們還做了一個(gè)叫力馭的智能駕駛計(jì)算平臺(tái),它只有一個(gè)單顆的AI芯片,我們的鴻途H30。整個(gè)這個(gè)平臺(tái)上面大概有200KDMIPS的CPU算力、高達(dá)256TOPS的AI算力,包括還有一些其他的接口。這個(gè)我們可以提供給合作伙伴作為參考設(shè)計(jì),也可以直接作為產(chǎn)品提供給我們的合作伙伴。
我們還做了智能駕駛計(jì)算使能平臺(tái)——Sailing平臺(tái),來幫助我們的客戶,不管是Tier1還是OEM,來幫助他們把芯片更好地應(yīng)用起來。
這里面有三個(gè)部分,最底層是我們作為產(chǎn)品提供的,包括了我們的芯片、系統(tǒng)軟件、軟件工具鏈。這是我們提供給客戶的產(chǎn)品。
同時(shí),我們還有一系列的參考設(shè)計(jì),包括剛才說的域控、一些參考算法,例如 Model Zoo這些東西是作為參考設(shè)計(jì)提供給客戶。最上面是客戶自己的軟件或者他們應(yīng)用層的軟件。
我重點(diǎn)說一下后摩大道這個(gè)軟件工具鏈。芯片既要性能強(qiáng),又要好用,這是業(yè)內(nèi)的一個(gè)共識(shí)。
我們希望提供一個(gè)具有差異化的、性能好的芯片,還有一個(gè)好用的編譯器工具鏈幫助客戶盡快地落地。這個(gè)工具鏈叫“大道”,大道至簡(jiǎn)、大道至臻,我們希望為客戶提供一個(gè)開放易用的軟件工具鏈。
一個(gè)年輕的公司
很多朋友之前問我,說你們存算一體,是不是軟件不好用?但事實(shí)上存算一體是一種底層的架構(gòu)創(chuàng)新,它其實(shí)解決的是底層計(jì)算單元的效率問題,它對(duì)上層的用戶是無感知的。
而上層的軟件開發(fā)或者使用,其實(shí)更多的是在IPU這一層,所以我們?cè)贗PU這一層做了很多的設(shè)計(jì),可以讓用戶體驗(yàn)更好。相對(duì)于早年那種黑盒式的或者封閉的模式,我們選擇走向一個(gè)更開放的、更通用的編程模式,這是我們軟件工具鏈最初的設(shè)計(jì)理念。
后摩大道首先是說我們提供了一套Model Zoo,可以讓大家用我們的參考模型去快速落地。
我們提供了一個(gè)模型開發(fā)的SDK、提供了一系列的算子庫(kù),客戶可以根據(jù)我們的算子庫(kù)去開發(fā)自己的模型。
對(duì)更高級(jí)的用戶,我們提供了一套算子開發(fā)的工具,就是我們開發(fā)了一層類似主流的編程語言,我們叫HDPL,你可以用這套語言訪問我們最底層的接口,可以開發(fā)出自己的這種算子,這個(gè)也是我們工具鏈的一部分。
總的目標(biāo)是,希望打造一個(gè)開放易用的軟件工具鏈,幫助我們的客戶把我們芯片盡快落地。
我們5月份剛剛發(fā)布的是第一代的量產(chǎn)產(chǎn)品鴻途H30,這個(gè)是為智能駕駛而設(shè)計(jì),包括商用車和乘用車。
我們正在研發(fā)的還有第二代的鴻途H50,這個(gè)是基于第二代的天璇架構(gòu),對(duì)大模型、對(duì)存算支持更好。
它還有一個(gè)特點(diǎn),可以在自然散熱條件下提供更大的有效算力。我們希望將存算一體能效比高的技術(shù)優(yōu)勢(shì),盡可能發(fā)揮到我們產(chǎn)品中去。這是我們正在自研的明年提供給客戶的第二代產(chǎn)品H50。
總結(jié)一下,后摩是一個(gè)年輕的公司,我們希望在長(zhǎng)久的發(fā)展過程中一直堅(jiān)持兩個(gè)原則。
第一個(gè)原則,我們堅(jiān)持底層技術(shù)創(chuàng)新的原則。就是用底層的架構(gòu)創(chuàng)新去給我們的客戶提供一個(gè)差異化的、互補(bǔ)的、優(yōu)質(zhì)的產(chǎn)品,讓大家多一個(gè)更好的國(guó)產(chǎn)替代的選擇。
第二個(gè)原則,我們一直是堅(jiān)守Tier2的定位和邊界,我們希望和Tier1或者OEM的客戶更多地合作,我們整個(gè)供應(yīng)鏈上下游的伙伴們一起去努力打破僵局,共同奔赴智能駕駛的美好終局。
標(biāo)簽: