隨著人工智能技術(shù)從實(shí)驗(yàn)室走向千行百業(yè),作為其算力基石的人工智能芯片,已成為全球科技競(jìng)爭(zhēng)的戰(zhàn)略制高點(diǎn)。從訓(xùn)練巨量參數(shù)的“大模型”到執(zhí)行具體任務(wù)的終端設(shè)備,不同場(chǎng)景對(duì)芯片的架構(gòu)、能效和成本提出了迥異的要求。當(dāng)前,產(chǎn)業(yè)格局呈現(xiàn)多元化競(jìng)爭(zhēng)態(tài)勢(shì),既有英偉達(dá)憑借其CUDA生態(tài)在GPU領(lǐng)域構(gòu)筑的深厚壁壘,也有谷歌TPU、華為昇騰等專(zhuān)用AI芯片的崛起,還有 Cerebras、Graphcore 等創(chuàng)業(yè)公司探索的顛覆性架構(gòu)。
在追求“最強(qiáng)大腦”的征程中,衡量標(biāo)準(zhǔn)已不單純是峰值算力。能效比、內(nèi)存帶寬、軟件棧的易用性與豐富度、以及對(duì)特定算法(如Transformer)的優(yōu)化程度,共同構(gòu)成了核心競(jìng)爭(zhēng)力。尤其是在人工智能通用應(yīng)用系統(tǒng)的構(gòu)建中,芯片需要具備高度的靈活性和可擴(kuò)展性,以應(yīng)對(duì)從云端訓(xùn)練到邊緣推理,從視覺(jué)識(shí)別到自然語(yǔ)言處理等紛繁復(fù)雜的任務(wù)。
誰(shuí)能成就支撐人工智能通用應(yīng)用系統(tǒng)的“最強(qiáng)大腦”?答案可能并非唯一。一種觀點(diǎn)認(rèn)為,通過(guò)先進(jìn)封裝技術(shù)將不同功能的芯粒(Chiplet)集成,形成異構(gòu)計(jì)算系統(tǒng),是兼顧性能與靈活性的可行路徑。另一種趨勢(shì)是“軟硬協(xié)同”的深度優(yōu)化,即針對(duì)主流AI框架和算法,從芯片指令集層面進(jìn)行定制設(shè)計(jì)。開(kāi)源指令集RISC-V的興起,也為AI芯片創(chuàng)新提供了新的底層架構(gòu)選擇,可能催生更多差異化的解決方案。
可以預(yù)見(jiàn),人工智能芯片的競(jìng)爭(zhēng)將是生態(tài)體系的全面較量。它不僅關(guān)乎硬件本身的性能,更依賴于整個(gè)軟件工具鏈、開(kāi)發(fā)者社區(qū)、應(yīng)用場(chǎng)景的深度融合。那個(gè)能夠以最高效率、最低成本賦能千行百業(yè)智能化轉(zhuǎn)型的“最強(qiáng)大腦”,或許將誕生于最開(kāi)放、最包容、最貼近實(shí)際需求的產(chǎn)業(yè)生態(tài)之中。這場(chǎng)關(guān)于算力王座的角逐,才剛剛進(jìn)入精彩的中盤(pán)。