深圳新聞網(wǎng)2025年10月17日訊(記者 呂攀)10月16日,在2025灣區(qū)半導(dǎo)體產(chǎn)業(yè)生態(tài)博覽會(huì)(灣芯展)上,云天勵(lì)飛副總裁羅憶發(fā)表主題演講,系統(tǒng)闡述了他對(duì)AI時(shí)代格局演變、算力結(jié)構(gòu)變革及國(guó)產(chǎn)芯片機(jī)遇的深度思考。
過(guò)去兩年,人工智能以驚人的速度席卷全球。從ChatGPT的橫空出世,到Sora等多模態(tài)模型的突破,再到中國(guó)DeepSeek R1的開(kāi)源,AI技術(shù)正以前所未有的節(jié)奏重塑產(chǎn)業(yè)格局。算力消耗不斷攀升,模型迭代從“年”縮短到“周”,全球AI正進(jìn)入一場(chǎng)以算力為核心的新競(jìng)賽。

AI推理時(shí)代開(kāi)啟,中國(guó)迎來(lái)新拐點(diǎn)
羅憶指出,人工智能已成為推動(dòng)人類進(jìn)入第四次工業(yè)革命的核心力量。過(guò)去三次工業(yè)革命中,中國(guó)與歐美的差距不斷拉大;但在AI時(shí)代,憑借數(shù)據(jù)規(guī)模、場(chǎng)景深度和工程化創(chuàng)新,中國(guó)正逐步實(shí)現(xiàn)“彎道超車”。他認(rèn)為,AI產(chǎn)業(yè)正在經(jīng)歷從“訓(xùn)練時(shí)代”到“推理時(shí)代”的關(guān)鍵轉(zhuǎn)折。
2022年底ChatGPT的出現(xiàn),讓AGI的概念從實(shí)驗(yàn)室走入公眾視野;而2025年DeepSeek R1模型的開(kāi)源,則標(biāo)志著中國(guó)在算法與工程優(yōu)化上的突破,證明國(guó)內(nèi)團(tuán)隊(duì)已能在半年內(nèi)追趕國(guó)際前沿水平。
“算法的平權(quán)與開(kāi)源,正在推動(dòng)AI應(yīng)用百花齊放?!绷_憶表示,“2025年很可能成為AI Agent產(chǎn)業(yè)落地的元年?!?/p>
從“堆算力”到“算力效率”的競(jìng)爭(zhēng)
過(guò)去幾年,全球AI產(chǎn)業(yè)的算力消耗呈指數(shù)級(jí)增長(zhǎng)。根據(jù)國(guó)家發(fā)改委數(shù)據(jù),中國(guó)AI產(chǎn)業(yè)的日均Token推理量在今年年中突破30萬(wàn)億,預(yù)計(jì)年底將翻倍。英偉達(dá)、華為等企業(yè)和機(jī)構(gòu)給出更大膽的預(yù)測(cè)——到2030年全球每日Token消耗量將是今天的一萬(wàn)倍。
“算力需求的增長(zhǎng)已進(jìn)入失衡狀態(tài)。”羅憶指出,“算力建設(shè)速度每年增長(zhǎng)一倍,但算力消耗每年卻在增長(zhǎng)十倍?!?/p>
這意味著,AI產(chǎn)業(yè)必須從“規(guī)模競(jìng)賽”轉(zhuǎn)向“效率競(jìng)賽”——用更少的算力支撐更多的推理任務(wù)。
在這一趨勢(shì)下,他預(yù)測(cè)兩個(gè)重要拐點(diǎn)曙光將現(xiàn):用于推理的算力將首次超過(guò)訓(xùn)練算力;國(guó)產(chǎn)AI芯片的使用量將首次超過(guò)國(guó)外芯片。
國(guó)產(chǎn)芯片的戰(zhàn)略機(jī)遇期正在到來(lái)
算力結(jié)構(gòu)的重構(gòu),為中國(guó)國(guó)產(chǎn)AI芯片帶來(lái)了前所未有的戰(zhàn)略機(jī)遇。一方面,美國(guó)對(duì)高端GPU出口的限制持續(xù)收緊;另一方面,國(guó)家層面出臺(tái)多項(xiàng)政策,明確提出要構(gòu)建自主可控的AI基礎(chǔ)設(shè)施體系。
“到2030年,中國(guó)AI算力規(guī)模的年復(fù)合增長(zhǎng)率有望達(dá)到100%,國(guó)產(chǎn)替代趨勢(shì)已經(jīng)非常明確?!绷_憶在演講現(xiàn)場(chǎng)說(shuō)道。
在AI推理時(shí)代,核心競(jìng)爭(zhēng)力不在于“更大的模型”,而在于“更高的算力效率”。有機(jī)構(gòu)預(yù)測(cè),未來(lái)三到五年,AI推理成本將每年下降一個(gè)數(shù)量級(jí)——從當(dāng)前百萬(wàn)Token約10元,降至2030年的1分錢。而要實(shí)現(xiàn)這一目標(biāo),必須在軟硬件協(xié)同優(yōu)化與算法芯片化創(chuàng)新上雙向突破。
云天勵(lì)飛自2014年成立以來(lái),始終堅(jiān)持“算法芯片化”路線,構(gòu)建了從邊緣到云端的AI推理產(chǎn)品體系。目前公司已推出四代自研神經(jīng)網(wǎng)絡(luò)處理器,廣泛應(yīng)用于視頻邊緣網(wǎng)關(guān)、智能機(jī)器人、推理服務(wù)器等場(chǎng)景。下一代產(chǎn)品將正式邁向GPNPU架構(gòu)——一種兼具GPU通用性與NPU高能效特性的全新計(jì)算范式,面向云端大模型推理。通過(guò)自研“算力積木”架構(gòu),讓芯片能夠像搭積木一樣靈活組合、按需擴(kuò)展,將標(biāo)準(zhǔn)計(jì)算單元模塊化封裝,形成不同算力級(jí)別的芯片,覆蓋8T至256T的算力區(qū)間,滿足不同產(chǎn)品、應(yīng)用場(chǎng)景對(duì)算力的需求。
迎接AI產(chǎn)業(yè)的“再平衡”
在演講最后,羅憶總結(jié)道:“AI推理時(shí)代的到來(lái),將重塑算力產(chǎn)業(yè)格局。真正的競(jìng)爭(zhēng),不再是算力規(guī)模的堆疊,而是誰(shuí)能在能效、成本與應(yīng)用落地之間找到新的平衡?!?/p>
他表示,云天勵(lì)飛將持續(xù)深耕芯片底座,推動(dòng)“從芯片到系統(tǒng)”的全棧創(chuàng)新,打造具備可擴(kuò)展性與普惠性的算力生態(tài)?!八懔Σ粦?yīng)是少數(shù)巨頭的資源,而應(yīng)成為推動(dòng)社會(huì)智能化的公共底座——這就是我們理解的‘計(jì)算時(shí)代新質(zhì)生產(chǎn)力’?!保ㄎ闹袌D片由云天勵(lì)飛提供)