99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

李飛飛團隊456頁最新報告:中美AI模型性能近乎持平,系統推理成本降至280分之一

0
分享至

每經記者:宋欣悅 每經編輯:蘭素英

4月8日,由李飛飛聯合領導的斯坦福大學以人為本人工智能研究所(Stanford HAI)發布了《2025年人工智能指數報告》(Artificial Intelligence Index Report 2025)。這份長達456頁的報告,深入剖析了2024年全球人工智能行業的發展態勢,揭示了12大關鍵趨勢。


圖片來源:斯坦福大學以人為本人工智能研究所官網

報告認為,AI正變得更高效、更普惠。隨著小模型性能飆升,達到GPT-3.5水平的系統推理成本在過去兩年間下降到了原來的280分之一。

報告還指出,中國高性能AI模型的數量和質量不斷提升,中美AI模型性能近乎持平。與此同時,中國在AI領域論文數量和專利數量上保持領先地位。


AI性能飆升,表現逐漸接近人類

2023年,研究人員推出了MMMU、GPQA和SWE-bench等頗具挑戰性的新基準測試,用于測試AI系統的極限。

測試發現,僅僅一年后,AI系統的性能便實現大幅躍升——在MMMU測試中得分提升18.8個百分點;在GPQA測試中提高48.9個百分點;SWE-bench測試里更是提升了67.3個百分點。

從整體趨勢來看,AI在各大領域的表現逐漸接近人類,甚至在某些情形下,AI智能體能在限時編程任務中超越人類


在部分評測指標上,AI技術性能表現與人類水平的對比 圖片來源:《2025年人工智能指數報告》

然而,復雜的推理對于AI模型而言,仍然是一個挑戰

在處理類似國際數學奧林匹克競賽題目這類任務時,AI模型表現出色。但面對諸如PlanBench等復雜推理基準測試時,卻仍顯得吃力。即使面對那些已知存在正解的邏輯任務,AI也經常無法可靠地解決邏輯任務,這極大限制了AI在對精度要求極高的高風險行業中的應用


各大模型在PlanBench基準測試上的正確率 圖片來源:《2025年人工智能指數報告》


全球AI投資飆升

2024年,生成式AI在全球范圍內吸引了339億美元的私人投資,與2023年相比,增長幅度達到18.7%。

與此同時,企業對AI的采用率顯著提升,從2023年的55%上升至2024年的78%。越來越多的研究結果表明,AI不僅能夠有效提升生產力,在多數情況下,還能縮小勞動力的技能差距。

值得關注的是,將生成式AI應用于至少一項業務職能的企業數量出現了激增。2023年,這一比例僅為33%,而到了2024年,該比例躍升至71%,增幅超過一倍。


2017年至2024年,將AI應用于至少一項業務職能企業的比例不斷上升 圖片來源:《2025年人工智能指數報告》


中美模型性能近乎持平

數據顯示,美國在AI模型的數量上處于領先地位。2024年,總部位于美國的機構擁有40個知名AI模型,超過中國(15個)和法國(3個)。


圖片來源:《2025年人工智能指數報告》

不過,報告強調,中美模型之間的性能差距正在迅速縮小。以MMLU和HumanEval等主流基準測試結果來看,2023年,中美頂尖模型之間的性能差距還在兩位數,然而到了2024年,這一差距已大幅縮小,幾乎處于同一水平

與此同時,中國在AI領域論文數量和專利數量上依舊保持領先地位


小模型性能飆升,推理成本降至280分之一

報告指出,AI正變得更加高效、經濟實惠和易于獲取。

隨著小模型性能提升,達到GPT-3.5水平的系統推理成本在過去兩年間下降至280分之一。在硬件層面,成本每年下降30%,而能源效率每年提高40%。

2022年,在MMLU基準測試中,得分超60%的最小模型是PaLM,參數量為5400億。到了2024年,微軟Phi-3-mini僅用38億參數,就取得了同樣的實力。這代表,兩年多的時間里模型參數減少了142倍。

此外,開源模型正在迎頭趕上,與閉源模型的差距逐漸縮小。2023年,開源模型明顯落后于閉源模型。而到2024年,這一差距幾乎消失。2024年1月初,頂尖閉源模型在大模型競技場排行榜上以8.0%的成績超過了頂尖開源模型。而到2025年2月,這一差距已縮小至1.7%。


2022年至2024年,在MMLU上得分高于60%的小模型 圖片來源:《2025年人工智能指數報告》


中國對AI的態度最樂觀

在對AI的態度方面,中國是全球主要國家和地區中最樂觀的

報告顯示,2024年中國有83%的人認為AI產品和服務利大于弊,排在后面的是印度尼西亞(80%)和泰國(77%)。相比之下,美國(39%)、加拿大(40%)等的樂觀情緒遠低于中國。


2022年至2024年,各國認為“使用AI產品和服務利大于弊”的比例 圖片來源:《2025年人工智能指數報告》

不過,從整體趨勢而言,各國對于AI的樂觀情緒正逐漸升溫,特別是在一些曾對AI最持懷疑態度的國家。數據顯示,自2022年起,美國認為“使用AI產品和服務利大于弊”的比例提升了4%,加拿大增長了8%,法國增長了10%。


三分之二受訪者稱AI將在未來3至5年對日常生活產生顯著影響

從醫療保健到交通運輸,AI正迅速從實驗室走向日常生活。

2023年,美國食品藥品監督管理局(FDA)批準了223款AI醫療設備,而2015年僅有6款。


1995年至2023年FDA批準的AI醫療設備數量 圖片來源:《2025年人工智能指數報告》

道路交通同樣因AI技術發生著日新月異的變化。自動駕駛汽車不再只是實驗,而是逐步駛入現實生活。

美國最大的運營商之一Waymo每周提供超過15萬次自動駕駛服務,而百度旗下的“蘿卜快跑”(Apollo Go)無人駕駛出租車隊已在中國多個城市正式投入運營。

此外,人們對AI融入日常生活的期待與認可度正在上升。據統計,全球范圍內,有多達三分之二的受訪者認為,在未來三到五年內,AI產品及服務將對日常生活產生顯著影響

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
貴州翻船打撈搜救50余人后續:幸存者發聲,曬災后景象自曝太幸運

貴州翻船打撈搜救50余人后續:幸存者發聲,曬災后景象自曝太幸運

古希臘掌管松餅的神
2025-05-04 21:31:04
著名通訊專家項立剛這次徹底演砸了!他兒子初中就去了美國留學?

著名通訊專家項立剛這次徹底演砸了!他兒子初中就去了美國留學?

翻開歷史和現實
2025-05-04 19:07:04
美國頂級預言家再出手!直言2025中美日命運!這個島最先出事!

美國頂級預言家再出手!直言2025中美日命運!這個島最先出事!

歷史八卦社
2025-05-04 20:47:01
英國斯諾克名記:趙心童是污點球員,讓他奪冠不利于斯諾克發展!

英國斯諾克名記:趙心童是污點球員,讓他奪冠不利于斯諾克發展!

銜春信
2025-05-05 00:12:45
朱中美(1990出生),被公開懸賞!

朱中美(1990出生),被公開懸賞!

環球網資訊
2025-05-04 16:40:35
中方高規格出席紅場閱兵,普京見證美印關系降級。

中方高規格出席紅場閱兵,普京見證美印關系降級。

老鼜尾聲電影解說
2025-05-04 21:33:56
烏克蘭動手了!克里米亞大橋被炸,閱兵大典前給俄全方位“體檢”

烏克蘭動手了!克里米亞大橋被炸,閱兵大典前給俄全方位“體檢”

柴刀夫司機
2025-05-04 16:15:07
俄外交部發言人:澤連斯基關于俄羅斯5月9日安全問題的言論構成直接威脅

俄外交部發言人:澤連斯基關于俄羅斯5月9日安全問題的言論構成直接威脅

俄羅斯衛星通訊社
2025-05-04 16:05:05
侄子代辦老人喪事花光23萬遺產遭索賠 法院判了:鋪張浪費,賠償62500元

侄子代辦老人喪事花光23萬遺產遭索賠 法院判了:鋪張浪費,賠償62500元

封面新聞
2025-05-04 15:09:13
55歲王菲坐飛機被偶遇,條紋T恤配鎖骨發美成少女,和謝霆鋒太配

55歲王菲坐飛機被偶遇,條紋T恤配鎖骨發美成少女,和謝霆鋒太配

瘋說時尚
2025-04-17 17:00:14
中科院武漢病毒所提出從頭合成型病毒RdRP引發-延伸轉換普適性機制

中科院武漢病毒所提出從頭合成型病毒RdRP引發-延伸轉換普適性機制

中國病毒學論壇
2025-05-04 21:24:29
白宮發言人卡洛琳怒了:“我們絕對不允許美國老百姓被這么剝削”

白宮發言人卡洛琳怒了:“我們絕對不允許美國老百姓被這么剝削”

荊楚寰宇文樞
2025-05-04 18:36:45
斯諾克世錦賽決賽第二階段:趙心童11-6馬克-威廉姆斯

斯諾克世錦賽決賽第二階段:趙心童11-6馬克-威廉姆斯

懂球帝
2025-05-05 05:01:22
多位省級黨政“一把手”的“五一”假期

多位省級黨政“一把手”的“五一”假期

政知新媒體
2025-05-04 19:17:47
江西“獸父”沈孝全被判死刑,三姐妹悲慘哭訴:他就是個畜生

江西“獸父”沈孝全被判死刑,三姐妹悲慘哭訴:他就是個畜生

懸案解密檔案
2025-05-03 16:32:01
世界冠軍發言引熱議:趙心童正在摧毀這項運動的標志性人物之一

世界冠軍發言引熱議:趙心童正在摧毀這項運動的標志性人物之一

標體
2025-05-05 00:44:45
她錯過靳東,轉身嫁給父親看中的女婿,如今45歲被婆家寵成公主!

她錯過靳東,轉身嫁給父親看中的女婿,如今45歲被婆家寵成公主!

素衣讀史
2025-05-04 10:57:07
看完全球手機市場 2024年利潤表,才知道誰才是真正的遙遙領先!

看完全球手機市場 2024年利潤表,才知道誰才是真正的遙遙領先!

翻開歷史和現實
2025-04-28 23:07:52
蘇杯金牌不好混,國羽6人未能站上領獎臺,只2人是謙讓

蘇杯金牌不好混,國羽6人未能站上領獎臺,只2人是謙讓

真理是我親戚
2025-05-05 00:12:54
五一7人燒烤被炸傷后續:現場畫面慘不忍睹,原因曝光家長要謹慎

五一7人燒烤被炸傷后續:現場畫面慘不忍睹,原因曝光家長要謹慎

奇思妙想草葉君
2025-05-05 00:01:54
2025-05-05 07:00:49
每日經濟新聞 incentive-icons
每日經濟新聞
中國主流財經全媒體平臺。
1232014文章數 2713257關注度
往期回顧 全部

科技要聞

巴菲特:理性看待AI炒作 耐心是關鍵

頭條要聞

貴州游船側翻游客:看見船翻了 當時就哭了

頭條要聞

貴州游船側翻游客:看見船翻了 當時就哭了

體育要聞

聯盟30隊首發得分后衛,他只能排第29位?

娛樂要聞

55歲王菲跟“李亞鵬時期”完全不同!

財經要聞

一個時代的結束!巴菲特年底將卸任

汽車要聞

小米SU7大優惠!5月限時購車權益送輔助駕駛

態度原創

健康
本地
親子
時尚
數碼

唇皰疹和口腔潰瘍是"同伙"嗎?

本地新聞

春色滿城關不住 | 花漾千陽!塬上秘境藏幾重詩意?

親子要聞

假期作業不能停! 楊雪呀

卷首語 | 今天,致敬青春,致敬自己!

數碼要聞

多年來首次設計重構:微軟13英寸Surface Laptop曝光,5月6日發布

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 乌恰县| 精河县| 临桂县| 新晃| 黄大仙区| 双辽市| 黄陵县| 怀化市| 高雄县| 新营市| 大荔县| 渝北区| 平度市| 博兴县| 富锦市| 广德县| 南乐县| 太和县| 介休市| 庆安县| 海兴县| 吴堡县| 大余县| 外汇| 天等县| 巴林右旗| 凉城县| 山西省| 富顺县| 河西区| 华池县| 梅州市| 东宁县| 广元市| 南昌县| 五常市| 大名县| 荣昌县| 海盐县| 阿拉善右旗| 潮安县|