網易首頁 > 網易號 > 正文申請入駐

周鴻祎的“慢思考”先見，領先OpenAI兩個月，大模型聯盟顯威力

2024-09-19 21:25:04　來源: 鯨選AI

北京舉報

分享至

作者：楊曉鶴

2024年，我們幾乎每隔一段時間，就會被新發布的大模型“顛覆”，但真正實現能力跨越的大模型，還得是近期發布的OpenAI o1-preview。

這款又名草莓的大模型，不是測評中的你追我趕誰分略高，而是直接超越了人類IQ的平均值，來到了博士水平的120分。正如下圖所示，o1-preview似乎已經越過了人類所謂的愚昧之巔。

o1-preview很聰明，但卻有個體驗性問題，那就是回答問題較慢，有美國教授測試個數學游戲，o1用了108秒來回答，很多人將大模型這一行為稱之為“慢思考”。

對于“慢思考”，山姆·奧爾特曼在o1發布后的第二天時盛贊：“這是一個重要的新范式的開始” 。在推出高效的GPT-4o 后，OpenAI 推出更慢的模型，令包括xAI、Google等企業暈圈。

但實際上，360集團創始人周鴻祎早在7月底的ISC.AI 2024大會上就指出：大模型目前只有快思考沒有慢思考的能力，我們要通過知識和工具，增強大模型的規劃，打造大模型的慢思考能力。

首次提出打造大模型“慢思考”能力的周鴻祎，和今天的o1大模型理念不謀而合。

如今o1似乎證明了一件事，在大模型領域奉為圭臬的“Scaling Law(規模定律)”路線之外，又找到了大模型能力提升的新范式。

大模型的演化方向是什么，為什么“慢思考”會成為趨勢？在國際和國內，OpenAI和360分別給出了問題的答案。

OpenAI的明燈，與360更早點燃的篝火

過去一年中，OpenAI公司管理十分動蕩，盡管其仍舊不斷推出新模型，但很多人并不太感冒。

沿著GPT-4o 路線，行業認為GPT-5 一定反應更快、多模態能力更強。而實現這一路徑的最簡單辦法，可能就是繼續堆積數據集和算力，沿著規模定律前進。

所以Anthropic為代表的大模型，模型參數越來越大，在編程和寫作等領域也有一定效果，某種程度上實現了對4o的超越；Grok也開始堆積算力，馬斯克豪言千億投資超級GPU超級工廠，新模型超越OpenAI。

這么做意味著，大模型變成資源密集型產業，這顯然不是大模型被創造的初衷。

這其中的關鍵，可能是傳統 LLM還鮮有意識到，整個輸出都通過 RLHF/RLAIF（人類反饋強化學習/ 人工智能反饋強化學習）機制進行獎勵/懲罰，所做的可以稱為結果監督（你向模型提供強大的推理示例，然后使用這個機制）。這是Anthropic 旗下Claude 3.5 Sonnet所采取的路線，也是大部分模型都在采用的模式。

如果將推理分解為具體步驟時，“過程監督”就被提煉出來。OpenAI 押注未來的發展模式就是過程監督，代表大模型產品為o1。這也是o1的最大特性，在推理環節，將行業算力從 “Scaling Law(規模定律)”向“Inference law(推理定律)”環節轉移。憑借self-play RL（自我博弈學習）和CoT（Chain-of-Thought,思維鏈），將推理環節效果提升到更好。

從下圖可以看出，GPT系列更側重在預訓練（Pre-Training）環節發力，體驗感則是更快回答簡單問題；而草莓系列則側重推理（Inference）環節，體驗感則是慢速回答復雜問題；二者呈現出了不同的發展趨勢。

誰更重要？誰是未來？周鴻祎認為這不是取舍關系，OpenAI 發展遵循的可能是“雙系統理論Dual Process Theory”，核心在于兩種系統并非獨立而是協同運作。這句判斷似乎是對OpenAI為何新造草莓系列大模型，更恰當的解釋。

正如諾貝爾獲得者、《思考，快與慢》一書作者丹尼爾卡尼曼曾說，人類大腦有兩個系統，分別是系統1和系統2，前者利用直覺和本能，高效處理95%的問題，而系統2則是復雜場景的理解，能處理5%很難的問題。

OpenAI在GPT-4 后明顯感知到，這系列為代表的1系統，進步難度變大。而草莓為代表的2系統，才剛剛開始。由此推測，其內部構建的更加智能的模型，或許就是模仿人類的大腦形式，用 GPT和o系列結合思維鏈的融合系統，前者用于“快思考”，后者實現“慢思考”。

從命名思路也可以佐證，OpenAI o1并不是OpenAI 的下一代產品，1代表奧特曼希望重置為1，是OpenAI在慢思考系列的實力展示。而4o則代表的GPT系列，還是快思考模式，未來GPT-5將是快思考與慢思考結合，GPT和O系列模型協作展現出來的新模型。

和OpenAI用兩大系列模型結合的路線相似，360借助更早發布的CoE（Collaboration-of-Experts,專家協同）架構，實現了思維鏈+多系統協同，集合了數量更多的大模型和專家模型，實現“快思考”和“慢思考”。

多系統協同中的大模型并非是360一家提供，而是聚集了國內主流大模型廠商，包括百度、火山引擎、騰訊、阿里巴巴、華為、智譜AI、月之暗面、MiniMax、百川智能、零一萬物、商湯科技、科大訊飛、好未來、Deepseek、面壁智能在內的最強“復仇者聯盟”。

標志事件是8月1日，周鴻祎在“ISC.AI 2024”上，宣布與國內16家大模型廠商達成合作，共同組成“CoE大模型聯盟”。

在提到多模型協作實現慢思考這一命題，周鴻祎在短視頻內容中這樣舉例解釋：

“如果讓一個真人，不假思索的回答問題，要求他寫作文不打草稿，或者復雜的數學題，沒有一個黑板寫滿演算步驟，實際上他也做不到的。”所以，周鴻祎很早思考多模型發展的思路：

“我們很早就在行業里提出了這樣一個（方案），利用智能體框架，結合大模型，打造慢思考模式的技術路線。現在看來，完全被OpenAI給驗證了。”智能體就是那塊黑板，多模型協作過程就是演算步驟，周鴻祎提出了自己的慢思考模式。

這一思考下，大模型聯盟逐漸發展成為「多模型協作」模式。將不同能力的大模型整合成360AI搜索等產品，對外輸出智能服務，讓多個大模型協作互補而非競爭發展。

周鴻祎率先意識到下一代大模型的發展，并不是只有“大力出奇跡”這一條路，與今天OpenAI的思路不謀而合，草莓大模型驗證了周鴻祎的思考。

多模型協作，360在產品端驗證威力

大模型發展到今天，一道“9.11和9.9誰大”，簡單的比數字大小的問題，難住了主流的大部分模型，普遍回答錯誤。

在360AI搜索上問此問題，依靠多模型做檢索糾錯，可以正確回答出這一問題，而這一問題，4o目前還是回答錯誤。

對于大部分大模型來說，這個問題可以通過微調直接修正，但真正處理這類問題，一種是推出o1這種推理能力非常強的模型，一種是利用大模型的協作模式，比其他單個大模型厲害，也能解決這個問題。

后一模式效果真的很好嗎？在測試中，鯨哥問了今天最熱的新聞，美聯儲降息50個點意味什么。在啟用深度回答后，360AI搜索開始啟動多任務智能體，背后就是多模型在協作。

據了解，在一次AI搜索的背后包含了至少7-15次的大模型調用，并對任務進行拆解，比如這次將問題先是意圖識別，然后是構建了多個工作流回答每一個步驟，再使多個大模型協同運作，讓每個模型給出擅長領域的答案，最后在對回答排序，輸出一份完整答案。

“一個模型負責回答一個答案，第二個模型負責對這答案負責審視、反思、挑錯，第三個模型根據前兩個模型的辯論，總結出最后的答案。” o1大模型展示的慢思考邏輯，與如今的360大模型的原理十分相似，都是競智路線上的創新。

再舉例360在AI翻譯中的步驟，執行翻譯動作、過程中反思、結果整合潤色。背后的邏輯，也是利用大模型競技場不斷battle的模式，當大模型記憶庫中沒有更好的回答，新的大模型正通過競爭“上崗”，選擇出做好的答案。

這套復雜的慢思考，在很多場景中效果都更好，比如用戶的Prompt寫的不清晰，CoE架構能夠通過意圖識別模型，更加理解用戶的實際需求。用戶問的問題太復雜，通過任務分解路由模型，讓各大模型、小模型之間協同配合。很多單一大模型難以回答的問題，也能被360混合大模型正確回答。

所以周鴻祎的“慢思考”，不是把16家廠商擺出來，讓用戶覺得哪個好用就用哪個，而是用新的架構組合成了互補協作的體系，讓16家大模型變為乘法關系，發揮出更大威力。

這正是目前的AI搜索混戰中，360AI搜索得以快速脫穎而出的原因之一。

好用才是用戶喜歡用的根本，360AI搜索的月獨立用戶數(UV)已經超過8000萬，是國內第一個達到這個量級的AI產品，將一眾國產AI ChatBot甩在身后。據Similarweb 數據顯示，2024年8月份，360AI搜索用戶訪問量已超 2 億，達 Perplexity AI 三倍以上，蟬聯全球最大的AI原生搜索引擎，并且勢能不減，還以113%的月增速，成為全球增速最快的主要AI搜索引擎。

或許很多讀者還是會產生疑問，是否只要引入更多模型，AI生成的回答質量就會更好呢？實際上，可能并不一樣，多個大模型組合在一起生成更好答案的關鍵，在于是否具有一套混合大模型智能調度系統，這是360的獨家秘密武器。

不走尋常路，360自己的『草莓架構』

大模型多模協作，實際上也早有共識。但大家走的路線并不一致。

Minimax最早在國內上線了MoE（Mixture-of-Experts）架構的稀疏混合專家模型，此后騰訊混元等各家大模型都開始積極跟進。國外也是MoE架構居多，MoE成為國際主流多模架構。

但MoE模型的專家之間存在競爭關系，選擇單一或者少數模型作答，模型本身的天花板以及錯誤率問題，都會影響最后的結果。這就難以避免幻覺問題，也難以實現“慢思考”。

相比之下，360推出了自己的『草莓架構』，不同于MoE，也即前文提到的CoE。

近兩個月前發布的CoE（Collaboration-of-Experts,專家協同）架構中，就構建了一個通過思維鏈和“多系統協同”的方式實現“快思考”和“慢思考”的混合大模型調度系統，能讓多個模型分工協作、并行工作，執行多步推理。

CoE模型推理過程圖源：《Collaboration of Experts: Achieving 80% Top-1 Accuracy on ImageNet with 100M FLOPs》

除了具有“慢思考”能力，CoE架構相較于MoE架構還擁有更精細的分工、更好的魯棒性、更高的效率和可解釋性和更強的泛化能力，可以在加快推理速度的同時，降低API接口和Token的使用成本。

綜合來看，360首創的CoE架構則集合了數量更多的大模型和專家模型，是通過思維鏈和“多系統協同”的方式實現“快思考”和“慢思考”。它的模型分工協作的方式，使得多家大模型發揮出各自的優點，并經過step by step 思考和糾正，最終總結給出更優質答案。

這意味著，CoE架構比OpenAI o1更早應用了思維鏈和反思決策模式，并且更進一步地應用在了360的AI搜索、AI瀏覽器和AI助手上，打造了AI原生搜索引擎的全球第一之外，還構建了國內首個大模型競技場平臺，效果確實突出。

大模型聯盟興起，抗衡OpenAI滅霸

國內此前也有平臺宣布接入集齊了大模型領域的全部實力玩家，也就是說接入了幾家獨角獸企業的大模型產品，但實際上只是讓產品接了入幾家大模型的API，用戶只能憑感覺選用一家的產品——和直接訪問其網站或App沒有區別。

而360集合百度、火山引擎、騰訊、阿里巴巴、華為、智譜AI、月之暗面等16家國內主流大模型廠商，是要組成戰斗力升級版的復仇者聯盟。

目前，所有這些廠商的54款大模型產品，都是接入了CoE架構，并基于該架構實現了1+1>2的協同效果，未來更是將全量接入100多個。

從產品層面看， 360 CoE 架構可以被分成兩個部分：其中，語料積累與算法技術，主要依靠的是360智腦在內的16家國產大模型的接入，類似分工不同的特種兵；而360則充當指揮官的角色，通過意圖識別模型，來實現對于用戶意圖更加精準的理解；通過任務分解和調度模型，實現了對于眾多專家模型網絡（100+LLM）、千億規模知識中樞和200+第三方工具的智能調度，進而實現比MoE更高的靈活性和效率。

如今，360已經在CoE路線上持續突飛猛進，近期又推出國內首個“大模型競技場”（ bot.360.com），支持調用54款大模型進行“同臺競技”，模型競技場也很有意思，上線了“組隊較量”、“匿名比拼”、“隨機對戰”等功能，成為更加公平的模型競技平臺。

尤其是“組隊較量”功能，使得用戶可以自由選定3款大模型，和任意一款或兩款大模型較量。

在每場競技中，用戶可以一次性添加任意2-3個對比模型，也可以隨時移除或替換為其他模型。模擬o1的自我博弈和強化學習過程。

競技場鍛煉了不同模型在不同問題下的最佳組合，用戶直觀感受是360混合大模型越來越厲害。事實也是如此，距第三方測試，該360混合大模型在翻譯、寫作等12項指標的測試中取得了80.49分的綜合成績，超越了GPT-4o的69.22分。

當然，360大模型聯盟并不是單純地聚在一起“跑分”，站在當下看未來，具有三層深意。

1、幫助眾多大模型找到應許之地，不再困于流量；

很多大模型缺乏落地場景以及用戶，尤其是大模型創業公司。而360的AI搜索、瀏覽器、安全衛士等至少擁有10億用戶的入口，眾多大模型借此找到了應許之地。“入口的流量，我覺得一步一步來，我們先開放兩大核心入口，一個是桌面，一個是瀏覽器，未來還會開放360搜索、360智能硬件。”周鴻祎在聯盟成立之初，就表示會逐步開放更多場景。

2、數據飛輪幫助大模型進化；

當下大模型的發展，囿于更好的數據集而難以進步，而o1合成數據集帶來的效果明顯，對行業是個刺激。對于國內頭部大模型廠商來講，360AI搜索就是基于CoE架構，能夠給大模型廠商持續提供用戶、數據和優化方向。這在合作模式上就會更深入，其他家大模型公司不會擔心被工具化。

3、“以競促練”提升行業水準

基于CoE架構的模型競技場，大模型競技場給國產大模型提供了一個“以競促練”的平臺，塑造了“比學趕幫超”的氛圍。對于各家大模型來說，不再是分散競爭，保密發展的情況，而是每天都可以跟進競技場的結果，調整自己的發展。

現階段，在國際，從大模型成果、LLM路線選擇以及落地工程化等維度，OpenAI向通過GPT-4o、o1等向業界證明，它仍在領導著行業進步。

于此同時在國內，360一手抓產品，借助CoE架構落地360AI搜索、360AI瀏覽器等行業或全球領先的產品；一手建平臺，成立大模型聯盟，打造AI助手，建立國內首個大模型競技平臺，推出多模型協作等等，為國產大模型的持續進化提供了平臺和方向。

時至今日，在AI大模型這條舉足輕重的賽道上，雖然還有各種困難橫亙在國內廠商面前，但是我們已經拿到了和國際水平幾乎平齊的身位，擁有了一較高下的實力。

AGI之路雖然，行則將至。未來AGI的黃冠上，必將有屬于我們中國大模型廠商的明珠！

AI鯨選社創建了行業高質量的『AIGC社群』，500位高質量行業人士已經入群，聚集上市公司CEO、所有互聯網大廠、創業者以及投資者、媒體人等。我們組建了高端技術產品交流群、AI熱點交流群、創投趨勢交流群，歡迎AGI行業人士入群。添加vx:xhyshow，注明真實身份。

草莓難救被“月拋”的AI對話產品？

庫克：iPhone 16夢想版，AI時代的割腎神機

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.