你如果關(guān)注AI領(lǐng)域的新聞,可能會在充滿矛盾的信息轟炸里深感困惑:有時,AI蓬勃發(fā)展,有時,AI是個泡沫。今天看,AI現(xiàn)有的技術(shù)和架構(gòu)將持續(xù)突破。明日嘆,AI發(fā)展模式不可持續(xù),需革命性新思路。此刻,AI或?qū)⒚驮夷愕娘埻耄∷麜r,AI也就給你講個故事解解悶兒的能耐!
斯坦福大學(xué)以人為本人工智能研究所(HAI)2025年4月初發(fā)布了《2025年AI指數(shù)報告》(The 2025 AI Index Report)。這份400多頁的報告主要通過數(shù)據(jù)圖表呈現(xiàn)事實、揭示趨勢,涵蓋了研發(fā)、技術(shù)表現(xiàn)、負(fù)責(zé)任AI、經(jīng)濟影響、科學(xué)醫(yī)療、政策、教育以及社會輿論等主題。《IEEE縱覽》雜志精選出了報告中最能反映AI領(lǐng)域現(xiàn)狀的12份關(guān)鍵圖表。
01
行業(yè)領(lǐng)頭羊
有許多標(biāo)準(zhǔn)可用于衡量各國在AI競賽中所處的身位,包括期刊論文發(fā)表數(shù)量、論文引用量以及專利數(shù)量等,不過最直觀的指標(biāo)莫過于“關(guān)鍵模型產(chǎn)自何處”。
研究機構(gòu)Epoch AI建立的數(shù)據(jù)庫收錄了1950年至今所有具有影響力的重大AI模型——上圖所示的數(shù)據(jù)就來自該庫。
可以看到,在2024年,美國產(chǎn)出了40個關(guān)鍵模型,中國有15個,歐洲有3個(全部來自法國)。另有一幅圖表(本文未展示)則告訴我們,這些模型幾乎全部來自企業(yè)而非學(xué)術(shù)界或政府。至于2023年至2024年間,關(guān)鍵模型數(shù)量下降的情況,報告認(rèn)為其原因可能在于技術(shù)復(fù)雜度升高和訓(xùn)練成本持續(xù)上漲。
02
訓(xùn)練成本知多少
要說訓(xùn)練成本,那是真貴!由于頭部的AI企業(yè)已不再披露訓(xùn)練相關(guān)信息,研究人員與Epoch AI合作,收集訓(xùn)練時長、硬件類型與數(shù)量等信息并據(jù)此估算。他們能估算出的最貴模型是由谷歌豪擲約1.92億美元打造的Gemini 1.0 Ultra。訓(xùn)練成本普漲的情況也呼應(yīng)了報告里的多項其他發(fā)現(xiàn),包括模型參數(shù)量、訓(xùn)練時長以及數(shù)據(jù)規(guī)模仍持續(xù)擴張的態(tài)勢。
異軍突起的中國新銳DeepSeek于今年初攪動了行業(yè)風(fēng)云,不過新報告未將其收入上述圖表。
關(guān)于DeepSeek的訓(xùn)練成本,業(yè)界存在部分質(zhì)疑,但它的表現(xiàn)無疑是現(xiàn)象級的,AI指數(shù)指導(dǎo)委員會聯(lián)合主任尤蘭達·吉爾(Yolanda Gil)評價其“令人印象深刻”,此外也指出計算機發(fā)展史上不乏低效技術(shù)被優(yōu)雅方案取代的案例。
她說道:“不止我一人認(rèn)為大語言模型終將出現(xiàn)更高效版本,但大家不清楚它將由誰打造、如何打造。”
03
使用AI的成本卻在下降
雖然圍繞(大多數(shù))AI模型的訓(xùn)練成本不斷攀升,但AI指數(shù)報告也強調(diào)了一些積極趨勢:硬件成本下降、硬件性能增強、能源效率提高。這意味著推理成本(即查詢已訓(xùn)練模型的花費)正急劇減少。上面這張采用對數(shù)刻度的圖表,展示了每美元AI性能的變化趨勢。報告指出,藍色線表明每百萬token成本從20美元降至0.07美元;粉色線表明在不到一年內(nèi),成本從15美元降至0.12美元。
04
AI的巨量碳足跡
誠然,能源效率提升是積極信號,但我們也必須直面負(fù)面趨勢:在能效改善的同時,總體能耗仍呈現(xiàn)增長。這意味著人工智能盛世的核心,即數(shù)據(jù)中心,正產(chǎn)生巨大碳足跡。AI指數(shù)報告根據(jù)訓(xùn)練硬件、云服務(wù)商以及地理位置等因素,對部分AI模型的碳排放進行評估,結(jié)果發(fā)現(xiàn)前沿AI模型訓(xùn)練的碳排放量持續(xù)上升——除了DeepSeek。
上方圖表中最糟糕的案例是Meta Llama 3.1模型,其產(chǎn)生的二氧化碳排放量預(yù)計高達8930噸,相當(dāng)于496個美國人生活一年的總排放。如此驚人的環(huán)境影響,解釋了為何AI公司紛紛將核能視作可靠的零碳電力來源。
05
性能差距正在縮小
美國發(fā)布的重大AI模型數(shù)量方面仍可謂遙遙領(lǐng)先,但中國模型的質(zhì)量水準(zhǔn)提升之大令業(yè)界嘆服。上方圖表顯示,在聊天機器人基準(zhǔn)測試中,中美雙方的模型性能差距逐漸縮小。2024年1月,美國最佳模型的表現(xiàn)較中國頂尖模型領(lǐng)先9.26%;到2025年2月,這一差距已縮小至1.70%。在推理、數(shù)學(xué)和編程等其他基準(zhǔn)測試中,也可觀察到類似趨勢。
06
人類的終極測驗
新報告還強調(diào)了一個無可爭議的事實:許多用于評估人工智能系統(tǒng)能力的基準(zhǔn)測試已趨于“飽和”——AI系統(tǒng)得分過高,以致測試不再有意義。這種現(xiàn)象已出現(xiàn)于常識、圖像推理、數(shù)學(xué)、編程等多個領(lǐng)域。
吉爾表示,她驚訝地目睹一個又一個基準(zhǔn)測試相繼失效。“我一直覺得(性能)會遇到瓶頸,必須依靠新技術(shù)或顛覆性的架構(gòu)才能繼續(xù)突破,可現(xiàn)實并非如此。”
鑒于此,科學(xué)家正努力創(chuàng)制新的基準(zhǔn)測試,以期挑戰(zhàn)AI系統(tǒng)。其中有一套名為“人類終極測驗”(Humanity’s Last Exam)的大殺招,匯集了由來自全球五百所機構(gòu)的學(xué)科專家提供的極限難題,成功難倒了現(xiàn)階段最頂尖的AI系統(tǒng):目前表現(xiàn)最好的應(yīng)試者是OpenAI的推理模型o1,其正確率達8.8%。此記錄可保持多久?讓我們拭目以待。
07
數(shù)據(jù)峰值的降臨
當(dāng)下的生成式AI通過從互聯(lián)網(wǎng)抓取海量數(shù)據(jù)并以此進行訓(xùn)練而獲得智能,這就催生了所謂“AI經(jīng)濟下,數(shù)據(jù)是石油”的說法。隨著人工智能企業(yè)不斷突破模型訓(xùn)練的數(shù)據(jù)上限,人們開始擔(dān)憂“數(shù)據(jù)峰值”何日到來。一個現(xiàn)實問題是:越來越多網(wǎng)站正限制爬蟲抓取數(shù)據(jù)(或許出于對AI公司既利用網(wǎng)站數(shù)據(jù)牟利又摧毀其商業(yè)模式的擔(dān)憂),這些限制都通過機器可讀的robots.txt文件聲明。
上方圖表顯示,頂級網(wǎng)站域名的數(shù)據(jù)已有48%被完全限制。不過吉爾指出,AI領(lǐng)域的新方法或可終結(jié)對龐大數(shù)據(jù)集的依賴。
“我預(yù)感,在某個時刻,數(shù)據(jù)量將不再那么關(guān)鍵。”
08
資本市場用腳投票
過去5年,來自企業(yè)界的資金洶涌入局AI。盡管2024年的全球總投資額不及2021年的狂熱高點,但要注意,私人投資規(guī)模可創(chuàng)下了歷史新高。在1500億美元的私人投資中(此處未顯示),約330億美元流向了生成式AI領(lǐng)域。
09
等待回報
企業(yè)豪擲千金,求的當(dāng)然是豐厚回報。眼下,我們興奮不已地談?wù)撊斯ぶ悄艿淖兏镏Γ瑫诚肭八匆姷纳a(chǎn)力飛躍,但客觀來說,企業(yè)尚未看到能帶來顯著成本節(jié)約或新增利潤的實質(zhì)改變。上面這份源于麥肯錫調(diào)研的圖表顯示:在報告降本的企業(yè)中,多數(shù)都只省下不足10%的錢;而在實現(xiàn)增收的企業(yè)中,大部分的增幅都低于5%。
雖然投資數(shù)據(jù)表明眾多企業(yè)押注人工智能,但現(xiàn)在談回報還為時尚早。
10
AI醫(yī)生即將上線?
在這波人工智能大熱潮中,科學(xué)和醫(yī)學(xué)領(lǐng)域涌現(xiàn)了令人驚喜的AI新氣象。AI指數(shù)報告列舉了多個新發(fā)布的基礎(chǔ)模型,它們將助力材料科學(xué)、天氣預(yù)報和量子計算等方面的研究。許多公司正嘗試將AI的預(yù)測與生成能力轉(zhuǎn)化為有利可圖的藥物發(fā)現(xiàn)。例如,OpenAI的o1推理模型最近在MedQA基準(zhǔn)測試(包含醫(yī)學(xué)委員會考試的題目)中展現(xiàn)了96%的準(zhǔn)確率。
但總體而言,上述領(lǐng)域遠未將AI潛力轉(zhuǎn)化為現(xiàn)實影響,因為人類似乎還沒完全搞懂怎么用AI技術(shù)。2024年一項研究顯示:醫(yī)生使用GPT-4輔助診斷后,并未因此提升診斷的準(zhǔn)確率或速度。另一方面,獨自做事的GPT-4反而強于獨自做事的醫(yī)生,也強于醫(yī)生+AI的組合。
11
關(guān)于AI政策
上方圖表告訴我們,美國國會關(guān)于AI的討論很多,實際行動很少。AI指數(shù)報告指出,美國的相關(guān)行動重心已轉(zhuǎn)向州一級:2024年共有131項州級法案通過立法,其中有56項涉及深度偽造技術(shù),禁止其被用于在選舉或傳播非自愿親密影像。
歐盟通過的《人工智能法案》針對高風(fēng)險AI系統(tǒng)給企業(yè)劃定了新的義務(wù)。而全球大趨勢是各國聯(lián)手協(xié)同,發(fā)表全面而不具約束力的聲明。那么有大量關(guān)于AI的內(nèi)容需要討論。
12
樂觀的人類繼續(xù)前行
關(guān)于“AI何時取代你的工作”的公共討論早已甚囂塵上。但有趣的是,一項最新的全球AI態(tài)度調(diào)查顯示,多數(shù)人并沒感受到威脅。受訪者來自32個國家,其中60%的人認(rèn)為人工智能將改變自己的工作方式,但只有36%的人覺得自己會被取代。
吉爾說道:“此結(jié)果令我非常意外。人們想著‘AI改變工作,而我仍創(chuàng)造價值’,這樣的心態(tài)令人鼓舞!”
那么,未來大家是否都能通過管理AI團隊來創(chuàng)造價值呢?待時間給出答案……
文章資料來源:12 Graphs That Explain the State of AI in 2025。文章觀點不代表主辦機構(gòu)立場。
◆ ◆ ◆
編輯郵箱:sciencepie@126.com
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.