99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

14款大模型能耗爆炸:DeepSeek竟然第一

0
分享至


智東西
編譯 陳駿達
編輯 Panken

跟AI聊天,究竟會消耗多少能源?

智東西6月20日報道,生成式AI正以前所未有的速度滲透進我們的日常生活,但鮮少有人關注其背后的環境代價。OpenAI CEO Sam Altman曾透露,ChatGPT單次查詢平均消耗0.34瓦時能源,相當于烤箱運行1秒多的耗電量,但憑借AI公司偶爾披露的零星數據,研究者無法對模型的能耗進行系統性評估

昨日,一項針對DeepSeek、Qwen、Llama、Cogito等14個開源大模型的研究,填補了這一空白,讓業內直觀看到了不同類型、不同參數規模的模型在能耗、碳排量和性能之間的差異。

在回答同類問題時,具備推理能力的模型能耗與碳排量為非推理模型的4-6倍,然而,這并未給模型答題的準確率帶來對應的提升,輕量級模型反而在某些簡單任務上展示出更高的能效。

在所有模型中,DeepSeek-R1 70B的平均碳排放量是最高的,其回答1道抽象代數問題會排放4.8g二氧化碳,相當于使用了0.01度電,能讓一只5W的燈泡持續亮燈2小時。來自硅谷新銳AI創企Deep Cogito的混合推理模型,在能耗和準確率上取得了不錯的平衡。


研究還用真實數據,揭示了AI“過度思考”的問題。推理模型在回答不同難度的問題時都會傾向于生成更多token、使用更多的計算資源,這導致了更高的排放量。同時,像抽象代數這樣的符號化和抽象領域對計算的需求更高,且準確率更低。

這一研究于昨日發表在國際期刊《通信前沿》上,研究者讓上方14款開源大模型各自回答了1000道問題,涉及抽象代數、高中數學、高中世界歷史、國際法、哲學這5個領域的內容,記錄了每個模型所使用的能源,并將其換算為碳排量。


論文鏈接:https://www.frontiersin.org/journals/communication/articles/10.3389/fcomm.2025.1572947/full

這篇論文的主要作者Maximilian Dauner稱:“我們并不總是需要最大、最密集的模型來回答簡單的問題,目標應該是為正確的任務選擇正確的模型。”

為評估模型能耗,研究者在本地的英偉達A100集群上部署了14款開源大模型,并使用高性能計算應用能源基準測試Perun框架對其能耗進行測量。研究者還將能耗按照480 gCO?/kWh的排放因子進行換算,以計算對應的碳排量,這一因子代表了目前全球的平均值。

研究使用的問題主要來自于MMLU基準測試,涵蓋了不同教育水平、不同領域。在多項選擇和自由回答兩類問題上,參數規模更大的模型始終保持了領先優勢。開啟推理模式的Cogito 70B的正確率排名第一,而DeepSeek-R1 70B的正確率排名第二


除了不同模型的準確性之外,這一研究還分析了模型在回答問題時產生的token數量。在多項選擇題中,模型平均每題生成37.7個token,而推理模型則需要額外使用543.5個token。

按學科劃分,高中數學題的答案最長,而抽象代數則需要最高的思考開銷(平均每題865.5個toekn)。研究中記錄到的最大推理長度(6716個token)來自于Deepseek-R1 7B模型在回答一道抽象代數問題時的思考。


下圖則反映了模型回答問題時的平均碳排量,這一數字從1.2克到1325.1克不等,模型的參數規模、是否開啟推理模式,都會直接影響平均碳排量。總體而言,推理模型的碳排量明顯高于非推理模型。


同時,研究者還將碳排量與準確性放到了同一張圖表上進行關聯研究。隨著模型規模的增加,準確性往往有所提高。然而,這種提升也與二氧化碳當量排放量和生成token數量的顯著增長密切相關。


最小的模型Qwen 7B擁有最低的碳足跡,但準確率僅為32.9%。相反,最大的推理模型Deepseek-R1 70B碳排量最高,但準確率達到78.9%。

值得注意的是,開啟推理模式的Cogito 70B展現出了性能和效率之間的平衡,實現了最高的84.9%準確率,同時碳排放還比DeepSeek-R1 70B模型少34.3%。這表明為大模型添加推理組件可以在不大幅增加碳排量的情況下顯著提高準確性。

結語:追求智能提升之外,推理效率提升不容忽視

研究者承認,這一研究尚未覆蓋千億參數規模的大模型,測試排放量時使用的GPU型號也并非當下最新、能效比最高的,因此研究結論無法直接外推到其他AI系統上。數據中心所使用的能源類型也會對碳排放量有明顯影響。

盡管這項研究存在局限性,但它仍然讓業界看到了能耗與模型準確性之間的關系。研究者稱,優化推理效率和回答的簡潔性,尤其是在像抽象代數這樣具有挑戰性的學科中,對于推動更可持續、更環保的AI技術發展至關重要。

目前,業內已有企業在探索“推理預算”、混合推理模型等能夠對模型推理長度做出一定限制的方法,但這些方法究竟能帶來多少能效的提升,仍有待進一步觀察。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
75歲老太擺攤賣菜被罰1萬,她交錢果斷離去,次日城管接到100個電話

75歲老太擺攤賣菜被罰1萬,她交錢果斷離去,次日城管接到100個電話

嘮叨情感屋
2025-06-17 10:56:01
汪峰牽手寧靜后,森林北評論區淪陷,她僅用一個舉動,表明了態度

汪峰牽手寧靜后,森林北評論區淪陷,她僅用一個舉動,表明了態度

叨嘮
2025-06-20 19:46:22
價格大跳水!昔日中年男人的“夢中情車”,半年狂降18萬

價格大跳水!昔日中年男人的“夢中情車”,半年狂降18萬

品牌觀察官
2025-06-18 22:13:10
泰總理被彈劾或將下臺:佩通坦說了什么讓自己陷于“魔咒”

泰總理被彈劾或將下臺:佩通坦說了什么讓自己陷于“魔咒”

梁佇愛玩車
2025-06-21 01:22:03
伊朗外長聯合國控訴以色列戰爭罪

伊朗外長聯合國控訴以色列戰爭罪

財聯社
2025-06-20 22:47:07
周鶴年私下向友人炫耀:明日花綺羅家里嘿咻!怒喊:不會這樣退團

周鶴年私下向友人炫耀:明日花綺羅家里嘿咻!怒喊:不會這樣退團

ETtoday星光云
2025-06-20 12:32:46
趙一鳴零食店被搶后續:縣政府介入,店主曝光全過程,官方回應

趙一鳴零食店被搶后續:縣政府介入,店主曝光全過程,官方回應

鋭娛之樂
2025-06-20 20:32:56
曾毅事件后續:天津演唱會取消,洛陽站終止,醫生建議他暫停工作

曾毅事件后續:天津演唱會取消,洛陽站終止,醫生建議他暫停工作

史書無明
2025-06-20 17:56:04
618懲罰來了!港人硬扛65寸電視回內地退貨!路人看傻眼!

618懲罰來了!港人硬扛65寸電視回內地退貨!路人看傻眼!

港漂圈
2025-06-20 20:41:15
要警惕了!各個門閥勢力在國內已經形成,對國家持續發展危害極大

要警惕了!各個門閥勢力在國內已經形成,對國家持續發展危害極大

麥大人
2025-06-18 12:05:19
為什么伊斯蘭國家里以色列誰都敢打,就是不敢打巴基斯坦?

為什么伊斯蘭國家里以色列誰都敢打,就是不敢打巴基斯坦?

荊楚寰宇文樞
2025-06-19 23:40:00
廣西人大常委會原副主任、桂林市委原書記周家斌被“雙開”

廣西人大常委會原副主任、桂林市委原書記周家斌被“雙開”

界面新聞
2025-06-20 18:34:47
北語教授張愛玲去世!去清華大學看女兒遭意外,現場慘烈畫面曝光

北語教授張愛玲去世!去清華大學看女兒遭意外,現場慘烈畫面曝光

清游說娛
2025-06-20 09:58:28
突發!伊朗導彈命中海法市人口密集區,城中升起100米高蘑菇云

突發!伊朗導彈命中海法市人口密集區,城中升起100米高蘑菇云

大道無形我有型
2025-06-20 23:18:36
畢業季=染艾季?4年1.2萬大學生感染艾滋!男男性行為成高發途徑

畢業季=染艾季?4年1.2萬大學生感染艾滋!男男性行為成高發途徑

烏娛子醬
2025-06-20 11:42:20
保守的老一輩玩的有多嗨?網友:這些故事不會都是真的吧

保守的老一輩玩的有多嗨?網友:這些故事不會都是真的吧

解讀熱點事件
2025-06-21 00:10:04
為什么全國各地突然嚴查年輕干部“混日子”問題?

為什么全國各地突然嚴查年輕干部“混日子”問題?

李昕言溫度空間
2025-06-19 14:58:57
上線后即引熱議!《撈女游戲》宣布改名《情感反詐模擬器》

上線后即引熱議!《撈女游戲》宣布改名《情感反詐模擬器》

快科技
2025-06-20 19:20:06
伊朗高層的“頭巾”被掀開了

伊朗高層的“頭巾”被掀開了

關爾東
2025-06-19 23:02:07
臺海開戰,美日聯手,我海軍將損失過半,傷亡萬人,臺島獨立?

臺海開戰,美日聯手,我海軍將損失過半,傷亡萬人,臺島獨立?

妙知
2025-06-19 20:46:44
2025-06-21 02:43:00
智東西 incentive-icons
智東西
聚焦智能變革,服務產業升級。
10044文章數 116775關注度
往期回顧 全部

科技要聞

余承東:鴻蒙6主打"毫秒級"時延與全面AI

頭條要聞

媒體:佩通坦錄音泄密 一聲"叔叔"恐致其聯合政府瓦解

頭條要聞

媒體:佩通坦錄音泄密 一聲"叔叔"恐致其聯合政府瓦解

體育要聞

周通:2年前想過退役,沒想到能踢世俱杯

娛樂要聞

黃曉明落榜原因曝光!葉珂曾秀幸福

財經要聞

58同城一邊裁員一邊跨界投資

汽車要聞

五項訂車禮/四款車型 一汽奧迪A5L正式開啟預售

態度原創

房產
親子
健康
藝術
教育

房產要聞

坑慘2000多人!恒大財富海南高管被曝非吸12.6億元!

親子要聞

孩子每天喝的水竟是‘致癌催化劑’?世衛組織:這 2 類水比地溝油更危險!

呼吸科專家破解呼吸道九大謠言!

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

教育要聞

大暴雨!7-9級雷暴大風!明日中考請提前出門!

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 扎兰屯市| 永泰县| 连州市| 琼结县| 柘城县| 乐东| 万宁市| 巨野县| 石泉县| 黔西| 勃利县| 叙永县| 根河市| 吉安县| 德格县| 永胜县| 赫章县| 长沙市| 白水县| 开江县| 方城县| 诸暨市| 启东市| 容城县| 历史| 葵青区| 富川| 且末县| 宜君县| 汝州市| 崇义县| 太和县| 高淳县| 娱乐| 得荣县| 泗洪县| 大宁县| 阿克苏市| 台南市| 万宁市| 叶城县|