99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

周鴻祎的“慢思考”先見,領先OpenAI兩個月,大模型聯盟顯威力

0
分享至


作者:楊曉鶴

2024年,我們幾乎每隔一段時間,就會被新發布的大模型“顛覆”,但真正實現能力跨越的大模型,還得是近期發布的OpenAI o1-preview。

這款又名草莓的大模型,不是測評中的你追我趕誰分略高,而是直接超越了人類IQ的平均值,來到了博士水平的120分。正如下圖所示,o1-preview似乎已經越過了人類所謂的愚昧之巔。


o1-preview很聰明,但卻有個體驗性問題,那就是回答問題較慢,有美國教授測試個數學游戲,o1用了108秒來回答,很多人將大模型這一行為稱之為“慢思考”。

對于“慢思考”,山姆·奧爾特曼在o1發布后的第二天時盛贊:“這是一個重要的新范式的開始” 。在推出高效的GPT-4o 后,OpenAI 推出更慢的模型,令包括xAI、Google等企業暈圈。

但實際上,360集團創始人周鴻祎早在7月底的ISC.AI 2024大會上就指出:大模型目前只有快思考沒有慢思考的能力,我們要通過知識和工具,增強大模型的規劃,打造大模型的慢思考能力。

首次提出打造大模型“慢思考”能力的周鴻祎,和今天的o1大模型理念不謀而合。

如今o1似乎證明了一件事,在大模型領域奉為圭臬的“Scaling Law(規模定律)”路線之外,又找到了大模型能力提升的新范式。

大模型的演化方向是什么,為什么“慢思考”會成為趨勢?在國際和國內,OpenAI和360分別給出了問題的答案。

OpenAI的明燈,與360更早點燃的篝火

過去一年中,OpenAI公司管理十分動蕩,盡管其仍舊不斷推出新模型,但很多人并不太感冒。

沿著GPT-4o 路線,行業認為GPT-5 一定反應更快、多模態能力更強。而實現這一路徑的最簡單辦法,可能就是繼續堆積數據集和算力,沿著規模定律前進。

所以Anthropic為代表的大模型,模型參數越來越大,在編程和寫作等領域也有一定效果,某種程度上實現了對4o的超越;Grok也開始堆積算力,馬斯克豪言千億投資超級GPU超級工廠,新模型超越OpenAI。

這么做意味著,大模型變成資源密集型產業,這顯然不是大模型被創造的初衷。

這其中的關鍵,可能是傳統 LLM還鮮有意識到,整個輸出都通過 RLHF/RLAIF(人類反饋強化學習/ 人工智能反饋強化學習) 機制進行獎勵/懲罰,所做的可以稱為結果監督(你向模型提供強大的推理示例,然后使用這個機制)。這是Anthropic 旗下Claude 3.5 Sonnet所采取的路線,也是大部分模型都在采用的模式。

如果將推理分解為具體步驟時,“過程監督”就被提煉出來。OpenAI 押注未來的發展模式就是過程監督,代表大模型產品為o1。這也是o1的最大特性,在推理環節,將行業算力從 “Scaling Law(規模定律)”向“Inference law(推理定律)”環節轉移。憑借self-play RL(自我博弈學習)和CoT(Chain-of-Thought,思維鏈),將推理環節效果提升到更好。

從下圖可以看出,GPT系列更側重在預訓練(Pre-Training)環節發力,體驗感則是更快回答簡單問題;而草莓系列則側重推理(Inference)環節,體驗感則是慢速回答復雜問題;二者呈現出了不同的發展趨勢。


誰更重要?誰是未來?周鴻祎認為這不是取舍關系,OpenAI 發展遵循的可能是“雙系統理論Dual Process Theory”,核心在于兩種系統并非獨立而是協同運作。這句判斷似乎是對OpenAI為何新造草莓系列大模型,更恰當的解釋。

正如諾貝爾獲得者、《思考,快與慢》一書作者丹尼爾卡尼曼曾說,人類大腦有兩個系統,分別是系統1和系統2,前者利用直覺和本能,高效處理95%的問題,而系統2則是復雜場景的理解,能處理5%很難的問題。

OpenAI在GPT-4 后明顯感知到,這系列為代表的1系統,進步難度變大。而草莓為代表的2系統,才剛剛開始。由此推測,其內部構建的更加智能的模型,或許就是模仿人類的大腦形式,用 GPT和o系列結合思維鏈的融合系統,前者用于“快思考”,后者實現“慢思考”。

從命名思路也可以佐證,OpenAI o1并不是OpenAI 的下一代產品,1代表奧特曼希望重置為1,是OpenAI在慢思考系列的實力展示。而4o則代表的GPT系列,還是快思考模式,未來GPT-5將是快思考與慢思考結合,GPT和O系列模型協作展現出來的新模型。

和OpenAI用兩大系列模型結合的路線相似,360借助更早發布的CoE(Collaboration-of-Experts,專家協同)架構,實現了思維鏈+多系統協同,集合了數量更多的大模型和專家模型,實現“快思考”和“慢思考”。

多系統協同中的大模型并非是360一家提供,而是聚集了國內主流大模型廠商,包括百度、火山引擎、騰訊、阿里巴巴、華為、智譜AI、月之暗面、MiniMax、百川智能、零一萬物、商湯科技、科大訊飛、好未來、Deepseek、面壁智能在內的最強“復仇者聯盟”。

標志事件是8月1日,周鴻祎在“ISC.AI 2024”上,宣布與國內16家大模型廠商達成合作,共同組成“CoE大模型聯盟”。


在提到多模型協作實現慢思考這一命題,周鴻祎在短視頻內容中這樣舉例解釋:

“如果讓一個真人,不假思索的回答問題,要求他寫作文不打草稿,或者復雜的數學題,沒有一個黑板寫滿演算步驟,實際上他也做不到的。”所以,周鴻祎很早思考多模型發展的思路:

“我們很早就在行業里提出了這樣一個(方案),利用智能體框架,結合大模型,打造慢思考模式的技術路線。現在看來,完全被OpenAI給驗證了。”智能體就是那塊黑板,多模型協作過程就是演算步驟,周鴻祎提出了自己的慢思考模式。

這一思考下,大模型聯盟逐漸發展成為「多模型協作」模式。將不同能力的大模型整合成360AI搜索等產品,對外輸出智能服務,讓多個大模型協作互補而非競爭發展。

周鴻祎率先意識到下一代大模型的發展,并不是只有“大力出奇跡”這一條路,與今天OpenAI的思路不謀而合,草莓大模型驗證了周鴻祎的思考。

多模型協作,360在產品端驗證威力

大模型發展到今天,一道“9.11和9.9誰大”,簡單的比數字大小的問題,難住了主流的大部分模型,普遍回答錯誤。

在360AI搜索上問此問題,依靠多模型做檢索糾錯,可以正確回答出這一問題,而這一問題,4o目前還是回答錯誤。

對于大部分大模型來說,這個問題可以通過微調直接修正,但真正處理這類問題,一種是推出o1這種推理能力非常強的模型,一種是利用大模型的協作模式,比其他單個大模型厲害,也能解決這個問題。

后一模式效果真的很好嗎?在測試中,鯨哥問了今天最熱的新聞,美聯儲降息50個點意味什么。在啟用深度回答后,360AI搜索開始啟動多任務智能體,背后就是多模型在協作。


據了解,在一次AI搜索的背后包含了至少7-15次的大模型調用,并對任務進行拆解,比如這次將問題先是意圖識別,然后是構建了多個工作流回答每一個步驟,再使多個大模型協同運作,讓每個模型給出擅長領域的答案,最后在對回答排序,輸出一份完整答案。

一個模型負責回答一個答案,第二個模型負責對這答案負責審視、反思、挑錯,第三個模型根據前兩個模型的辯論,總結出最后的答案。” o1大模型展示的慢思考邏輯, 與如今的360大模型的原理十分相似,都是競智路線上的創新。

再舉例360在AI翻譯中的步驟,執行翻譯動作、過程中反思、結果整合潤色。背后的邏輯,也是利用大模型競技場不斷battle的模式,當大模型記憶庫中沒有更好的回答,新的大模型正通過競爭“上崗”,選擇出做好的答案。


這套復雜的慢思考,在很多場景中效果都更好,比如用戶的Prompt寫的不清晰,CoE架構能夠通過意圖識別模型,更加理解用戶的實際需求。用戶問的問題太復雜,通過任務分解路由模型,讓各大模型、小模型之間協同配合。很多單一大模型難以回答的問題,也能被360混合大模型正確回答。

所以周鴻祎的“慢思考”,不是把16家廠商擺出來,讓用戶覺得哪個好用就用哪個,而是用新的架構組合成了互補協作的體系,讓16家大模型變為乘法關系,發揮出更大威力。

這正是目前的AI搜索混戰中,360AI搜索得以快速脫穎而出的原因之一。

好用才是用戶喜歡用的根本,360AI搜索的月獨立用戶數(UV)已經超過8000萬,是國內第一個達到這個量級的AI產品,將一眾國產AI ChatBot甩在身后。據Similarweb 數據顯示,2024年8月份,360AI搜索用戶訪問量已超 2 億,達 Perplexity AI 三倍以上,蟬聯全球最大的AI原生搜索引擎,并且勢能不減,還以113%的月增速,成為全球增速最快的主要AI搜索引擎。

或許很多讀者還是會產生疑問,是否只要引入更多模型,AI生成的回答質量就會更好呢?實際上,可能并不一樣,多個大模型組合在一起生成更好答案的關鍵,在于是否具有一套混合大模型智能調度系統,這是360的獨家秘密武器。

不走尋常路,360自己的『草莓架構』

大模型多模協作,實際上也早有共識。但大家走的路線并不一致。

Minimax最早在國內上線了MoE(Mixture-of-Experts)架構的稀疏混合專家模型,此后騰訊混元等各家大模型都開始積極跟進。國外也是MoE架構居多,MoE成為國際主流多模架構。

但MoE模型的專家之間存在競爭關系,選擇單一或者少數模型作答,模型本身的天花板以及錯誤率問題,都會影響最后的結果。這就難以避免幻覺問題,也難以實現“慢思考”。

相比之下,360推出了自己的『草莓架構』,不同于MoE,也即前文提到的CoE。

近兩個月前發布的CoE(Collaboration-of-Experts,專家協同)架構中,就構建了一個通過思維鏈和“多系統協同”的方式實現“快思考”和“慢思考”的混合大模型調度系統,能讓多個模型分工協作、并行工作,執行多步推理。


CoE模型推理過程 圖源:《Collaboration of Experts: Achieving 80% Top-1 Accuracy on ImageNet with 100M FLOPs》

除了具有“慢思考”能力,CoE架構相較于MoE架構還擁有更精細的分工、更好的魯棒性、更高的效率和可解釋性和更強的泛化能力,可以在加快推理速度的同時, 降低API接口和Token的使用成本。

綜合來看,360首創的CoE架構則集合了數量更多的大模型和專家模型,是通過思維鏈和“多系統協同”的方式實現“快思考”和“慢思考”。它的模型分工協作的方式,使得多家大模型發揮出各自的優點,并經過step by step 思考和糾正,最終總結給出更優質答案。

這意味著,CoE架構比OpenAI o1更早應用了思維鏈和反思決策模式,并且更進一步地應用在了360的AI搜索、AI瀏覽器和AI助手上,打造了AI原生搜索引擎的全球第一之外,還構建了國內首個大模型競技場平臺,效果確實突出。

大模型聯盟興起,抗衡OpenAI滅霸

國內此前也有平臺宣布接入集齊了大模型領域的全部實力玩家,也就是說接入了幾家獨角獸企業的大模型產品,但實際上只是讓產品接了入幾家大模型的API,用戶只能憑感覺選用一家的產品——和直接訪問其網站或App沒有區別。

而360集合百度、火山引擎、騰訊、阿里巴巴、華為、智譜AI、月之暗面等16家國內主流大模型廠商,是要組成戰斗力升級版的復仇者聯盟。

目前,所有這些廠商的54款大模型產品,都是接入了CoE架構,并基于該架構實現了1+1>2的協同效果,未來更是將全量接入100多個。

從產品層面看, 360 CoE 架構可以被分成兩個部分:其中,語料積累與算法技術,主要依靠的是360智腦在內的16家國產大模型的接入,類似分工不同的特種兵;而360則充當指揮官的角色,通過意圖識別模型,來實現對于用戶意圖更加精準的理解;通過任務分解和調度模型,實現了對于眾多專家模型網絡(100+LLM)、千億規模知識中樞和200+第三方工具的智能調度,進而實現比MoE更高的靈活性和效率。

如今,360已經在CoE路線上持續突飛猛進,近期又推出國內首個“大模型競技場”( bot.360.com),支持調用54款大模型進行“同臺競技”,模型競技場也很有意思,上線了“組隊較量”、“匿名比拼”、“隨機對戰”等功能,成為更加公平的模型競技平臺。

尤其是“組隊較量”功能,使得用戶可以自由選定3款大模型,和任意一款或兩款大模型較量。

在每場競技中,用戶可以一次性添加任意2-3個對比模型,也可以隨時移除或替換為其他模型。模擬o1的自我博弈和強化學習過程。

競技場鍛煉了不同模型在不同問題下的最佳組合,用戶直觀感受是360混合大模型越來越厲害。事實也是如此,距第三方測試,該360混合大模型在翻譯、寫作等12項指標的測試中取得了80.49分的綜合成績,超越了GPT-4o的69.22分。

當然,360大模型聯盟并不是單純地聚在一起“跑分”,站在當下看未來,具有三層深意。

1、幫助眾多大模型找到應許之地,不再困于流量;

很多大模型缺乏落地場景以及用戶,尤其是大模型創業公司。而360的AI搜索、瀏覽器、安全衛士等至少擁有10億用戶的入口,眾多大模型借此找到了應許之地。“入口的流量,我覺得一步一步來,我們先開放兩大核心入口,一個是桌面,一個是瀏覽器,未來還會開放360搜索、360智能硬件。”周鴻祎在聯盟成立之初,就表示會逐步開放更多場景。

2、數據飛輪幫助大模型進化;

當下大模型的發展,囿于更好的數據集而難以進步,而o1合成數據集帶來的效果明顯,對行業是個刺激。對于國內頭部大模型廠商來講,360AI搜索就是基于CoE架構,能夠給大模型廠商持續提供用戶、數據和優化方向。這在合作模式上就會更深入,其他家大模型公司不會擔心被工具化。

3、“以競促練”提升行業水準

基于CoE架構的模型競技場,大模型競技場給國產大模型提供了一個“以競促練”的平臺,塑造了“比學趕幫超”的氛圍。對于各家大模型來說,不再是分散競爭,保密發展的情況,而是每天都可以跟進競技場的結果,調整自己的發展。

現階段,在國際,從大模型成果、LLM路線選擇以及落地工程化等維度,OpenAI向通過GPT-4o、o1等向業界證明,它仍在領導著行業進步。

于此同時在國內,360一手抓產品,借助CoE架構落地360AI搜索、360AI瀏覽器等行業或全球領先的產品;一手建平臺,成立大模型聯盟,打造AI助手,建立國內首個大模型競技平臺,推出多模型協作等等,為國產大模型的持續進化提供了平臺和方向。

時至今日,在AI大模型這條舉足輕重的賽道上,雖然還有各種困難橫亙在國內廠商面前,但是我們已經拿到了和國際水平幾乎平齊的身位,擁有了一較高下的實力。

AGI之路雖然,行則將至。未來AGI的黃冠上,必將有屬于我們中國大模型廠商的明珠!

AI鯨選社創建了行業高質量的『AIGC社群』,500位高質量行業人士已經入群,聚集上市公司CEO、所有互聯網大廠、創業者以及投資者、媒體人等。我們組建了高端技術產品交流群AI熱點交流群創投趨勢交流群,歡迎AGI行業人士入群。添加vx:xhyshow,注明真實身份。

草莓難救被“月拋”的AI對話產品?

庫克:iPhone 16夢想版,AI時代的割腎神機

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
為擴大國際影響力,巴西足協將國家隊官方賬號更改為“巴西”

為擴大國際影響力,巴西足協將國家隊官方賬號更改為“巴西”

懂球帝
2025-07-26 00:55:08
人到中年后,不要過度共情你的父母,尤其是不要和他們住在一起

人到中年后,不要過度共情你的父母,尤其是不要和他們住在一起

明月讀書吧
2025-06-18 15:10:03
71歲成龍斷崖式衰老,年輕時太拼命,透支身體太多

71歲成龍斷崖式衰老,年輕時太拼命,透支身體太多

健康觸點
2025-07-25 06:07:27
三個姑姑分掉女孩父親遺產后續:二姑身份被扒,瓜分百萬遭起訴

三個姑姑分掉女孩父親遺產后續:二姑身份被扒,瓜分百萬遭起訴

阿纂看事
2025-07-25 17:28:52
美團王興:3年狂投30家,中國具身智能最大金主

美團王興:3年狂投30家,中國具身智能最大金主

鈦媒體APP
2025-07-25 14:13:31
貴州高分考生被廈門大學馬來西亞分校誤錄取?學校回應:已有不少學生申請退檔

貴州高分考生被廈門大學馬來西亞分校誤錄取?學校回應:已有不少學生申請退檔

瀟湘晨報
2025-07-25 11:24:42
蘇林大清洗后,越南對華釋放最強信號,前所未有

蘇林大清洗后,越南對華釋放最強信號,前所未有

科技處長
2025-07-24 23:29:21
實錘?網傳杜建英有丈夫,還有一個36歲大兒子,宗慶后竟然是三哥

實錘?網傳杜建英有丈夫,還有一個36歲大兒子,宗慶后竟然是三哥

壹月情感
2025-07-20 22:06:40
表哥出國前把摩托7600賣我,這天換電瓶掀開座椅,看到里面我愣了

表哥出國前把摩托7600賣我,這天換電瓶掀開座椅,看到里面我愣了

蘭姐說故事
2025-07-23 05:05:03
7月25日,浙江2025養老金調整細則公布,取消了一個特別做法

7月25日,浙江2025養老金調整細則公布,取消了一個特別做法

甜檸聊史
2025-07-25 12:45:15
96小時遭襲震動了全球,澤連斯基深夜求和

96小時遭襲震動了全球,澤連斯基深夜求和

智慧天氣通
2025-07-25 08:26:54
宗澤后被打臉:杭州公證處繼承公證書曝光,宗慶后施幼珍并未離婚

宗澤后被打臉:杭州公證處繼承公證書曝光,宗慶后施幼珍并未離婚

做一個合格的吃瓜群眾
2025-07-25 14:19:01
西工大、鐵一中、高新一中、西交附中、濱河中學2025中考屏蔽學生

西工大、鐵一中、高新一中、西交附中、濱河中學2025中考屏蔽學生

金哥說新能源車
2025-07-25 17:47:54
湖南考生625分被四川大學退檔,提檔分619,因不服從調劑沒書讀

湖南考生625分被四川大學退檔,提檔分619,因不服從調劑沒書讀

小義了不休
2025-07-24 17:53:10
甘肅張掖馬蹄寺,怕游客偷窺景區風景:對路人收300元過路費

甘肅張掖馬蹄寺,怕游客偷窺景區風景:對路人收300元過路費

阿昌走遍中國
2025-07-23 11:25:34
駐港國家安全公署:堅決支持香港警方依法對袁弓夷等19名外逃亂港分子采取執法行動

駐港國家安全公署:堅決支持香港警方依法對袁弓夷等19名外逃亂港分子采取執法行動

澎湃新聞
2025-07-25 15:09:02
癌癥父親當眾下跪,只為讓女兒在遺囑上簽字!女兒:我憑什么?

癌癥父親當眾下跪,只為讓女兒在遺囑上簽字!女兒:我憑什么?

諾言卿史錄
2025-07-23 10:21:32
“落魄”的馬未都,已經玩不轉了?

“落魄”的馬未都,已經玩不轉了?

收藏大視界
2025-07-22 20:13:48
夜場女孩會和大哥廝混嗎?網友:看污了我的眼睛,不純潔了

夜場女孩會和大哥廝混嗎?網友:看污了我的眼睛,不純潔了

解讀熱點事件
2025-06-14 00:05:03
還是沒有熬過楊振寧!陪伴21年后,冷凍9顆卵子的翁帆痛苦嗎?

還是沒有熬過楊振寧!陪伴21年后,冷凍9顆卵子的翁帆痛苦嗎?

明月聊史
2025-07-17 15:29:09
2025-07-26 02:51:00
鯨選AI incentive-icons
鯨選AI
最新AI產品化與商業化案例速遞
99文章數 20關注度
往期回顧 全部

科技要聞

36款熱門車高危智駕場景測試,“團滅”!

頭條要聞

8旬翁下葬前墓地被人埋死狗沿路埋鐵釘暗器 官方介入

頭條要聞

8旬翁下葬前墓地被人埋死狗沿路埋鐵釘暗器 官方介入

體育要聞

3年過去了,她還是歐洲杯上最酷的姐

娛樂要聞

汪蘇瀧不忍了 !張碧晨痛失《年輪》演唱權

財經要聞

劉煜輝:當下重要不是找確定性而是轉折點

汽車要聞

李斌一口氣講了近3個小時樂道L90 原因是為啥?

態度原創

本地
時尚
教育
健康
公開課

本地新聞

換個城市過夏天|風拂鹽湖,躲進格爾木的盛夏清涼

今年夏天一定要有這件衣服,好看又復古!

教育要聞

再獲國際物理奧賽金牌,南師附中學子勇登世界之巔!

呼吸科專家破解呼吸道九大謠言!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 婺源县| 元谋县| 印江| 柳林县| 明溪县| 巢湖市| 深州市| 富阳市| 若羌县| 鄂州市| 临沭县| 雷州市| 五华县| 定西市| 宣武区| 珲春市| 谢通门县| 高密市| 中方县| 麻阳| 囊谦县| 平安县| 杭锦旗| 招远市| 阿拉善左旗| 佛坪县| 台东县| 天长市| 荆州市| 恩施市| 长寿区| 高安市| 射阳县| 白山市| 静安区| 和田市| 滨州市| 延津县| 南丰县| 临城县| 西安市|