99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

斯坦福團隊開發AI數據提取框架,為能源領域數據獲取難題提供方案

0
分享至

溫室氣體排放的準確評估與減排是能源領域的重大挑戰,但石油和天然氣行業的關鍵數據通常分散在昂貴的商業數據庫中,其存在數據碎片化、雜亂且難以獲取的問題。此外,該領域的官方數據更新相對滯后,傳統人工提取方法效率低下且容易出錯。

針對上述問題,美國斯坦福大學博士生陳震林及其所在課題組基于大語言模型開發了一種創新的框架。

該技術利用大模型(GPT-4 和 GPT-4o)卓越的文本理解能力(遠超傳統文字識別技術),能夠從石油天然氣領域的公開文獻(包括學術期刊論文和新聞報道等多元數據格式)中高效提取關鍵數據。

這一框架展現出兩大核心優勢:

一是經濟性顯著提升,通過優化 GPT-4o 的應用,使單數據點提取成本降低達 10 倍(0.04 美元);

二是效率高,在測試數據集上實現了 83.74% 的準確率與 78.16% 的 F1 分數,證明了其在在內的多源信息中的適應性與可靠性。

據介紹,這是斯坦福團隊首例在石油天然氣領域的應用。該工具不僅解決了傳統數據獲取的難題,更能為溫室氣體排放的精準評估和全生命周期分析提供可靠支撐,最終服務于科學政策制定和環境管理決策的優化。


圖丨陳震林(來源:陳震林)

日前,相關論文以《通過大語言模型數據提取推進油氣排放評估》(Advancing oil and gas emissions assessment through large language model data extraction)為題發表在Energy and AI[1]。斯坦福大學博士生陳震林擔任第一作者兼通訊作者。


圖丨相關論文(來源:Energy and AI)

該框架的創新之處在于利用 GPT-4 和 GPT-4o 等大模型,通過迭代優化提示詞(prompt engineering)實現油氣行業關鍵數據的高效提取。

為驗證方法的有效性,該課題組首先構建了一個包含 108 份文檔的專業數據集,涵蓋氣油比、水油比等 51 個核心參數,并采用領域專家人工標注的方式建立基準數據以提升模型準確率。


(來源:Energy and AI)

陳震林對 DeepTech 進一步解釋道:“我們整合了領域專業知識與數值計算方法,包括物理方程和熱力學方程的運用。然后,將專家計算結果與大模型輸出進行多輪比對和迭代優化。”

隨后,研究人員進一步進行微調,分析每篇文章在數據庫中提取出錯以及與人工標注結果不符的原因。

細致的誤差分析結果顯示,數據偏差可能來自兩個方面:一方面,人工標注本身存在誤差,在某些情況下大模型的判斷反而更準確;另一方面,模型在單位換算或數值處理時會出現混淆。

針對這些問題,研究人員對其進行更多的訓練和校正,使訓練后的準確率從初始的 63.6% 顯著提升到了 83.74%(如下表)。


表丨提示迭代訓練結果(來源:Energy and AI)

從文檔處理效率方面來看,使用新方法從 32 篇文檔中提取大量數據僅需 61.41 分鐘,處理一個文檔平均僅需 7.09 秒,較手動方法實現了顯著提升。

值得注意的是,研究還揭示了文本類型對提取效率的影響——由于字段結構更簡單、內容更直白,新聞類文章的提取速度明顯優于技術文獻。

陳震林指出,研究過程中的關鍵挑戰在于開發最優的零樣本學習方法,這需要通過對提示策略的持續迭代來尋找最佳解決方案。


(來源:Energy and AI)

該課題組不僅建立了一套系統的提示優化方法論,更探索出充分發揮大模型潛力的技術路徑,為能源領域數據提取提供了可復用的研究范式。

需要了解的是,該框架的應用范圍不僅限于能源行業的上游領域,其強大的適應性使其同樣適用于中游和下游環節的數據提取任務。例如,在發電領域,該技術可高效處理能源監管機構發布的年度發電站報告,以及各國政府定期發布的能源統計報告。

這些報告數據來源多樣,既包含傳統油氣領域信息,也涵蓋下游發電產業(如數據中心運營數據)和各類結構化表格數據。

對此,陳震林特別強調:“我們致力于開發具備遷移學習能力的框架體系,使其能夠通過'舉一反三'的機制,在不同應用場景中創造新的價值。”


(來源:Energy and AI)

在未來的研究階段,研究人員計劃繼續優化準確率和架構。陳震林表示:“我們當初在做這項研究時只能依賴 GPT,但現在隨著大模型的不斷迭代和發展,可以讓包括 DeepSeek 在內的多個模型混合共同閱讀文獻并交叉驗證,從而進一步提升模型的可靠性。”

目前,該團隊的龍文男博士已完成一項關于全球液化天然氣碳排放測算的深入研究,系統追蹤了從上游開采到下游應用的完整供應鏈碳足跡,相關論文已進入投稿階段。

此外,研究人員還計劃基于錯誤分析機制,更深入地揭示大模型本身在某些方面理解錯誤率較高的原因。“我們將通過大規模錯誤樣本分析,精確識別模型的理解盲區和易錯點,這些發現將直接指導后續的模型優化。”陳震林說。

在應用層面,該課題組在本次研究中已完成了上游環節的定性分析,接下來將重點拓展至中游和下游的全面評估。“我們期待這項研究能成為 AI 與能源領域深度結合的重要工作,為全球氣候政策的科學制定提供關鍵數據支撐。”陳震林說。

參考資料:

1.Zhenlin Chen et al. Advancing oil and gas emissions assessment through large language model data extraction.Energy and AI(2025). https://doi.org/10.1016/j.egyai.2025.100481

運營/排版:何晨龍

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
沙特聯射手榜:C羅24球暫列第一,托尼+本澤馬緊追不舍

沙特聯射手榜:C羅24球暫列第一,托尼+本澤馬緊追不舍

雷速體育
2025-05-24 13:57:20
官宣!中國人入境歐洲有新規!還要被收這些……

官宣!中國人入境歐洲有新規!還要被收這些……

維城
2025-05-23 18:45:32
山東有座土豪村,年收入超1000億元,還吞并了周邊8座村莊

山東有座土豪村,年收入超1000億元,還吞并了周邊8座村莊

芭比衣櫥
2025-05-24 15:17:25
反轉!雨雨雨,馬上抵達安徽!最高氣溫24.7℃!

反轉!雨雨雨,馬上抵達安徽!最高氣溫24.7℃!

肥東論壇
2025-05-24 22:44:47
英媒:阿莫林可能今夏離任,曼聯考慮聘請阿萊格里

英媒:阿莫林可能今夏離任,曼聯考慮聘請阿萊格里

雷速體育
2025-05-24 19:59:14
NBA雷霆隊奪冠亞歷山大能比肩喬丹嗎?

NBA雷霆隊奪冠亞歷山大能比肩喬丹嗎?

止境
2025-05-25 01:11:54
鄒佳祺:進國家隊源于在北京隊的努力!江蘇球迷:勿忘江蘇的培養

鄒佳祺:進國家隊源于在北京隊的努力!江蘇球迷:勿忘江蘇的培養

金毛愛女排
2025-05-25 00:00:11
蘋果+生姜丟水里煮,血管刷得干干凈凈!三高人群快收藏

蘋果+生姜丟水里煮,血管刷得干干凈凈!三高人群快收藏

江江食研社
2025-05-24 08:30:08
最年輕的生于1999年,3名“95后”干部擬任副科級領導

最年輕的生于1999年,3名“95后”干部擬任副科級領導

每日經濟新聞
2025-05-25 00:52:14
對手定了!成都蓉城在亞冠精英聯賽附加賽將對陣泰超亞軍曼谷聯

對手定了!成都蓉城在亞冠精英聯賽附加賽將對陣泰超亞軍曼谷聯

紅星新聞
2025-05-24 22:42:13
小托馬斯:錫伯杜在臨場指揮中被壓制了,每年崩盤都因為只用主力不信替補

小托馬斯:錫伯杜在臨場指揮中被壓制了,每年崩盤都因為只用主力不信替補

雷速體育
2025-05-24 11:09:17
她是首屆春晚主持人,搶閨蜜男友為愛兩次自殺,二婚嫁給前夫叔叔

她是首屆春晚主持人,搶閨蜜男友為愛兩次自殺,二婚嫁給前夫叔叔

夢想總該是有的
2025-05-24 22:48:15
鬧離隊,離開泰山隊讓他后悔,當初拒絕續約,如今渴望回歸

鬧離隊,離開泰山隊讓他后悔,當初拒絕續約,如今渴望回歸

體壇風之子
2025-05-24 07:16:16
一路走好!3天4位老藝術家接連去世,都是因病離世,最大的71歲

一路走好!3天4位老藝術家接連去世,都是因病離世,最大的71歲

比利
2025-05-22 20:13:35
果然有問題!人在ICU怎么去借款?法院院長道歉,律師將被追責

果然有問題!人在ICU怎么去借款?法院院長道歉,律師將被追責

奇思妙想草葉君
2025-05-24 23:46:50
石川佳純喊話中國小伙娶她?不要彩禮,不會變成全職太太

石川佳純喊話中國小伙娶她?不要彩禮,不會變成全職太太

開成運動會
2025-05-04 23:17:52
網友一覺醒來天塌了這太社死了,鴻蒙版微信能看到自己給別人備注!

網友一覺醒來天塌了這太社死了,鴻蒙版微信能看到自己給別人備注!

滑稽斑馬呀
2024-12-07 11:16:11
游泳冠軍賽:潘展樂9金+徐嘉余5金,浙江兩大奧運冠軍領銜問鼎

游泳冠軍賽:潘展樂9金+徐嘉余5金,浙江兩大奧運冠軍領銜問鼎

燒體壇
2025-05-24 21:08:54
被爆不雅照,與馮紹峰戀愛三年分手,如今36歲靠著劉德華再次翻紅

被爆不雅照,與馮紹峰戀愛三年分手,如今36歲靠著劉德華再次翻紅

贏梯
2025-05-22 09:05:13
奔馳車主掄桿砸車后續!正臉照被曝,態度囂張不差錢,弟弟被牽連

奔馳車主掄桿砸車后續!正臉照被曝,態度囂張不差錢,弟弟被牽連

奇思妙想草葉君
2025-05-23 21:01:18
2025-05-25 04:56:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
15212文章數 513696關注度
往期回顧 全部

科技要聞

不止蘋果?特朗普:三星不在美國造 也加稅

頭條要聞

朱媛媛系在福建拍戲時病發 同組演員:當時她咳得很厲害

頭條要聞

朱媛媛系在福建拍戲時病發 同組演員:當時她咳得很厲害

體育要聞

世乒賽混雙三連冠!莎頭舉國旗比“3”

娛樂要聞

歌手2025第二期排名:居然是他淘汰了

財經要聞

不得不說,特朗普殺瘋了

汽車要聞

一見傾心!東風全新SUV定妝圖曝光,顏值氣場并存

態度原創

房產
親子
教育
游戲
公開課

房產要聞

連續17次提前交付!海口這座頂流紅盤,業主贏麻了!

親子要聞

小嬰兒張著小嘴巴發出咕嚕咕嚕的聲音

教育要聞

新傳考研人每天都在“進度焦慮”。

還真有二游偷師型月學成了?美術立繪劇情演出,這味兒全對!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 玉山县| 沙河市| 金溪县| 连州市| 涿州市| 静乐县| 开封市| 清水河县| 礼泉县| 南康市| 合江县| 彭泽县| 喀什市| 乌兰察布市| 浦城县| 博乐市| 仙游县| 微博| 普陀区| 蒙山县| 大姚县| 竹北市| 沽源县| 定远县| 封丘县| 威海市| 云浮市| 慈溪市| 如东县| 永春县| 濉溪县| 济源市| 唐河县| 垦利县| 招远市| 曲周县| 马公市| 赤水市| 神木县| 苍溪县| 罗山县|