99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

人工智能也需要思考時間:淺談 “測試時計算” 的含義

0
分享至


來源:全球技術地圖

2025年3月,蘭德公司(RAND)發布《當人工智能需要時間思考時:淺談“測試時計算”的含義》(When AI Takes Time to Think: Implications of Test-Time Compute),文章介紹了“測試時計算”(Test-Time Compute,TTC)在推理型人工智能模型中的興起及其深遠影響。啟元洞見編譯文章主要內容,旨在為讀者了解“測試時計算”帶來的結構性變革提供參考。

隨著OpenAI的o1、o3和DeepSeek的R1等推理型模型的出現,人工智能開發體系中增添了一項重要能力:“測試時計算”(Test-Time Compute,TTC),這項能力在推理過程中顯著提升了模型性能。不同于傳統模型直接輸出答案的方式,推理模型采用顯式的分步思考流程,即通過“邊思考邊表達”的方式,嘗試多種解題路徑、生成中間推理步驟,并對可能的解答進行比較評估,最終凝練出更可靠的輸出結果。

在一些情況下,人們甚至可以允許模型“思考”數分鐘生成幾十頁文本,然后模型將這段詳盡推理壓縮為用戶看到的一句簡潔回答。盡管這并非顛覆性的技術革命,但它是人工智能技術發展演進的一部分,已經在政策、產業格局與安全等領域引發連鎖反應。如同其他技術進步一樣,其影響不會立竿見影,但從長遠來看,其累積效應可能深遠且不可忽視。

計算能力如何影響人工智能
的生命周期

在探討“測試時計算”的影響之前,應先理解計算能力在人工智能開發與部署過程中的作用。過去,訓練階段計算量的持續提升一直是推動人工智能進步的主要動力它使得人們能夠訓練出越來越強大的擁有更多參數、使用更多數據的模型。而如今,測試時計算能力作為一個新增變量,進入了這套機制。人工智能發展的路徑曾被簡單理解為“擴大預訓練計算規模”,但實際上遠比這復雜。隨著推理階段計算量的引入,這個路徑進一步變得多元復雜,從原先調控一個變量,轉變為同時優化多個變量的系統工程。

簡言之,計算能力通過以下四個關鍵階段推動模型能力的提升。

(一)實驗階段

在這個階段,研究人員測試各種架構設計(例如超參數、學習率及其他變量),尋找最優方案,作為后續大規模訓練的基礎。

(二)預訓練階段

在這個階段,研究人員通過在互聯網龐大的數據集上對模型進行大規模訓練,為模型建立基礎能力。

(三)后訓練階段

在這個階段,研究人員通過強化學習、指令微調等方法,讓模型在某些特定任務中表現優異或者更像一個聊天機器人。近年來,還新增了通過強化學習來教會模型“逐步推理”能力的功能。

(四)部署階段

部署階段包括部署能力與部署規模。關于部署能力,指模型在響應用戶提問時“思考”的時間,即測試時計算能力關于部署規模,指系統的用戶規模或人工智能體的部署數量當數以百萬計用戶同時發出請求時,這就成為影響性能的關鍵因素。

當前的變化,不在于計算能力是否仍然重要,而在于計算能力在哪些階段、以何種方式發揮作用。一個常見的誤解是,由于推理模型變得更高效,計算能力的重要性下降。事實恰恰相反,這些所謂的高效新進展,仍然是建立在大規模預訓練基礎模型之上的,而訓練這些模型需要動用數千塊加速芯片和數百萬美元的資源投入。

當模型完成初步訓練后,人們會發現兩個新的“可擴展杠桿”出現了:一個是后訓練階段,在此階段可以通過強化學習進一步塑造模型的推理能力;另一個是推理階段,這個階段與過去主要依賴訓練數據規模和模型體量來提升能力不同,推理型模型通過在此階段投入更多計算時間,也能夠顯著增強其解決問題的能力,盡管這種能力仍然建立在預訓練打下的基礎和后續訓練形成的推理機制之上。

如今“測試時計算”為推動人工智能能力增長開辟了新的路徑。盡管當前這一變化看似緩慢演進,但未來可能對人工智能的技術生態與相關政策體系帶來深遠影響。

測試時計算的六大影響

(一)創新周期正在加速

隨著已經投身推理研究的團隊(如OpenAI、DeepSeek等)以及更多新入局者的不斷探索,人工智能的性能提升將加速發展。在這一新興研究領域中,迭代速度更快,只需通過強化學習或增加推理時間即可提升性能,無需耗資數百萬美元進行一次全新的預訓練,這使得更新成本更低。

此外,這種相對低門檻的性能提升方式吸引了更多開發者參與人工智能研究,尤其是學術界的研究者,他們更傾向于分享發現,從而加速行業進步。這也將推動技術的共享,已有前沿模型擁有者與相對弱勢競爭者之間的差距可能會比預訓練主導時代更快縮小但與此同時,預訓練方面的進展仍在持續,每一代重大躍升仍可能帶來新的能力鴻溝。

性能提升最快的領域,預計將是那些具備清晰反饋機制、結果易于驗證的領域,尤其是數學和軟件工程領域。這一點具有重要意義,因為許多模型開發者本身就是軟件工程師,這將形成一個正向反饋循環:工程師利用模型提升工作效率,帶來更多使用與創新,從而催生更優秀的下一代模型。但這種推理能力是否能順利遷移到其他領域仍需時間驗證。

(二)技術共享加速,同時維持領先優勢

測試時計算同時服務于領先企業與中小開發者,先進模型可借此獲得更強推理能力,較小規模的系統也可實現過去需要大規模預訓練才能達到的性能。但這并不意味著計算門檻的降低或消失,而是人工智能演進中算法效率提升的又一次飛躍,即在既定性能水平下所需的計算成本變得更低但要推進最前沿的能力,仍需巨大的資源投入。

領先企業通過在其最新、最大模型中集成推理技術來維持優勢。而中小開發者則能以更有限的資源達成過去的頂尖表現,雖然差距縮小,但尚未完全彌合。

(三)分級使用推理模型

測試時計算促進了人工智能能力的靈活性,同一個模型,依據任務中分配的計算資源不同,可以展現出不同的“智能水平”。這一問題目前就已顯現:是否必須訂閱高級版本才能使用最先進的能力?對于簡單查詢,可能并無必要,但許多用戶為了在特定任務中獲得更優表現,仍會選擇付費升級。展望未來,用戶不僅要挑選合適的模型,還可能需要決定讓模型“思考”多長時間,以平衡效率與性能。

(四)部署能力:從“部署規模”到“部署
規模與智能水平的協同提升”

部署時的計算資源一直是決定人工智能影響力的關鍵,它決定了可以服務多少用戶,進而影響人工智能在不同行業、領域的滲透程度。而如今,測試時計算的引入加劇了計算資源與模型智能之間的耦合關系,同一模型在被分配不同的推理時間后會表現出不同“智商”。

這一變化帶來了重要的地緣政治與經濟影響。在地緣政治方面,計算資源充足的國家可以通過補貼人工智能服務的方式在國際上擴大軟實力。在經濟方面,擁有推理計算資源的國家,擁有著將先進人工智能批量部署并盈利的能力,這可能形成“部署成功-賺取利潤-繼續升級”的正反饋機制。

(五)合成數據推動能力飛輪

推理能力的進一步提升可能依賴于“合成推理數據”的生成,即由人工智能自行產出的推理樣本,這類數據將成為越來越有價值的戰略資源。每一代模型都借助上一代生成的推理樣式來進行強化,從而進一步增強下一代模型的推理能力,形成加速能力進化的閉環。

同時,這一機制也可能加劇數據安全風險,使“推理數據竊取”成為新隱患。但從長期看,保護此類合成數據可能并不現實,數據獲取途徑可能會迅速擴散。例如DeepSeek R1所共享的鏈式思維推理方式,已經惠及其他團隊。這種推理數據的廣泛傳播,也可能進一步縮小前沿技術擁有者與相對弱勢競爭者之間的差距。

(六)政策制定面臨信息不對稱挑戰

隨著人工智能能力的不斷躍升,從外部視角做出明智的政策決策正變得越來越困難。推理模型的技術細節及其發展路徑常被公司作為商業秘密加以保護,這造成了開發者與政策制定者之間日益擴大的信息鴻溝。若不正視并彌補這些信息不對稱,政策制定者可能將越來越難以跟上人工智能演化的腳步。

結語

測試時計算并非顛覆性地改寫了人工智能發展的全部邏輯,但它無疑引入了一個重要的新變量,值得政策制定者高度重視。這是人工智能發展中的一次結構性演進,新增的變量正在重新塑造政策應對的重點和邊界。

事實表明,人工智能的發展并不是沿著一條單一、持續上升的曲線前行如今,這一進程更像是多條曲線并行推進(包括預訓練、強化學習和測試時計算等)。然而,政策體系往往滯后于技術發展,常常在新變量已經深刻影響產業發展和社會走向后,政策制定者才意識到其帶來的挑戰。

閱讀最新前沿科技趨勢報告,請訪問歐米伽研究所的“未來知識庫”

https://wx.zsxq.com/group/454854145828


未來知識庫是“ 歐米伽 未來研究所”建立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。

截止到3月31日 ”未來知識庫”精選的百部前沿科技趨勢報告

(加入未來知識庫,全部資料免費閱讀和下載)

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
廣東調整增加基本養老金 900多萬名退休人員受益

廣東調整增加基本養老金 900多萬名退休人員受益

南方都市報
2025-07-25 17:00:55
7月25日,遼寧2025養老金調整細則公布,掛鉤0.3%,3千元漲多少?

7月25日,遼寧2025養老金調整細則公布,掛鉤0.3%,3千元漲多少?

甜檸聊史
2025-07-25 17:14:14
劉寶杰喊大罷免“好牌打到輸”!郭正亮:他感嘆民進黨這事

劉寶杰喊大罷免“好牌打到輸”!郭正亮:他感嘆民進黨這事

新時光點滴
2025-07-25 15:46:00
一個雞爪10根簽,美女吃四川串串花了418元,飯店曝光引網友狂噴

一個雞爪10根簽,美女吃四川串串花了418元,飯店曝光引網友狂噴

北緯的咖啡豆
2025-07-21 19:47:36
汪小菲帶兒女逛街!玥兒穿 4 萬外套,阿姨司機陪同,姐弟倆很開心

汪小菲帶兒女逛街!玥兒穿 4 萬外套,阿姨司機陪同,姐弟倆很開心

二妹扯娛
2025-07-24 09:55:05
6月威海乳山216套海景房“1元起拍”:來自90余個小區,二手房東為加快周轉試水

6月威海乳山216套海景房“1元起拍”:來自90余個小區,二手房東為加快周轉試水

澎湃新聞
2025-07-25 17:46:31
伊朗女間諜身份曝光!與120名高官發生過關系,大量情報泄露

伊朗女間諜身份曝光!與120名高官發生過關系,大量情報泄露

小嵩
2025-07-16 15:16:07
郭碧婷發型凌亂與友人聚餐,旁邊的向佐像流浪漢

郭碧婷發型凌亂與友人聚餐,旁邊的向佐像流浪漢

章眽八卦
2025-07-25 12:29:56
汪峰前妻葛薈婕直播哽咽:女兒小蘋果不想認自己,汪峰和女兒的聯系方式都沒有

汪峰前妻葛薈婕直播哽咽:女兒小蘋果不想認自己,汪峰和女兒的聯系方式都沒有

TVB的四小花
2025-07-25 01:52:28
驚艷!莫文蔚的演唱會“衣不蔽體”,才明白郭德綱為何要說那句話

驚艷!莫文蔚的演唱會“衣不蔽體”,才明白郭德綱為何要說那句話

石場阿鑫
2025-07-24 09:32:44
崔保華,在市委書記,省委常委、統戰部部長,省政協副主席等任上大肆斂財

崔保華,在市委書記,省委常委、統戰部部長,省政協副主席等任上大肆斂財

政知新媒體
2025-07-25 10:15:35
大疆掃地機器人官宣 8月6日正式發布 顏值這一塊穩了

大疆掃地機器人官宣 8月6日正式發布 顏值這一塊穩了

手機中國
2025-07-23 21:13:02
中美多個關鍵貿易均已徹底中斷!

中美多個關鍵貿易均已徹底中斷!

邊際財經實驗室
2025-07-25 09:20:50
董璇再婚與張維伊分居,理由是我女兒不方便,倪萍一句話暗示結果

董璇再婚與張維伊分居,理由是我女兒不方便,倪萍一句話暗示結果

科學發掘
2025-07-25 19:35:25
中國花游隊世錦賽奪冠,西班牙隊表現突出

中國花游隊世錦賽奪冠,西班牙隊表現突出

許礆很機智
2025-07-25 21:31:40
《掃毒風暴》大結局:王林拒捕慘死,盧少驊坦然赴死,吳燕萍圓滿

《掃毒風暴》大結局:王林拒捕慘死,盧少驊坦然赴死,吳燕萍圓滿

涵豆說娛
2025-07-25 13:17:55
6年前,施一公砸200億建起西湖大學,放話5年贏過清華,如今咋樣

6年前,施一公砸200億建起西湖大學,放話5年贏過清華,如今咋樣

戶外小阿隋
2025-07-02 01:30:31
百團大戰是背著毛主席擅自發起的?彭德懷晚年坦承:當時是急了點

百團大戰是背著毛主席擅自發起的?彭德懷晚年坦承:當時是急了點

貴妃最歷史
2025-07-25 09:20:37
老祖宗常告誡“勿近白虎”,“白虎”究竟是什么?真有這么可怕嗎

老祖宗常告誡“勿近白虎”,“白虎”究竟是什么?真有這么可怕嗎

大千世界觀
2025-05-22 16:57:05
直到宗慶后人設崩塌,才懂賭王臨終前,把私生子交給何超瓊含金量

直到宗慶后人設崩塌,才懂賭王臨終前,把私生子交給何超瓊含金量

攬星河的筆記
2025-07-18 22:29:50
2025-07-26 01:39:00
人工智能學家 incentive-icons
人工智能學家
人工智能領域權威媒體
4046文章數 37238關注度
往期回顧 全部

科技要聞

36款熱門車高危智駕場景測試,“團滅”!

頭條要聞

8旬翁下葬前墓地被人埋死狗沿路埋鐵釘暗器 官方介入

頭條要聞

8旬翁下葬前墓地被人埋死狗沿路埋鐵釘暗器 官方介入

體育要聞

3年過去了,她還是歐洲杯上最酷的姐

娛樂要聞

汪蘇瀧不忍了 !張碧晨痛失《年輪》演唱權

財經要聞

劉煜輝:當下重要不是找確定性而是轉折點

汽車要聞

李斌一口氣講了近3個小時樂道L90 原因是為啥?

態度原創

健康
房產
親子
藝術
軍事航空

呼吸科專家破解呼吸道九大謠言!

房產要聞

分數線集體飆漲!海中867分!2025海南中招格局大變!

親子要聞

小宸哥歷險記之門外有人:不要給陌生人開門

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

軍事要聞

吳謙少將任中國駐埃及使館國防武官

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 静安区| 萍乡市| 历史| 北海市| 郎溪县| 夏河县| 荆州市| 八宿县| 五大连池市| 镇原县| 象山县| 会昌县| 吴川市| 富宁县| 丰原市| 塔河县| 铅山县| 嘉祥县| 郴州市| 隆回县| 湘乡市| 冕宁县| 海晏县| 万宁市| 镇平县| 博白县| 固镇县| 五大连池市| 浑源县| 阿图什市| 辛集市| 沙河市| 同德县| 阿克苏市| 孟连| 秭归县| 青浦区| 边坝县| 寿光市| 时尚| 安龙县|