堅持不在豆包中接入DeepSeek的字節,在自研深度思考功能上又有了新動作。
繼3月18日豆包APP全量上線深度思考功能后,時隔十天之后,近期豆包又對深度思考功能做了番更新,主要亮點在于將聯網搜索能力直接融進了思考過程中,可以實現“邊想邊搜”。直白點理解,就相當于豆包把聯網搜索鍵與深度思考鍵合二為一了。
此前,在DeepSeek R1爆火后,深度思考和聯網搜索兩大功能,一度成為AI助手類產品的設計新標準。
根據字母榜(ID:wujicaijing)實際體驗,豆包上述二合一的新產品設計,除了在頁面布局上直接消滅了聯網搜索鍵外,更重要的內在改變是重構了大模型的推理過程。
DeepSeek R1在開啟聯網搜索后,其推理過程是先搜索網頁,再根據網頁內容展開思考,一般只進行一輪搜索。作為對比,豆包融合聯網搜索的深度思考模式,則是先進行一番思考,然后基于思考去搜索相應網頁,并結合網頁具體內容再展開新的思考,往往會進行2-3輪的多輪搜索。
更形象地類比,“豆包等于把聯網搜索做成了一個內置在深度思考功能內的Agent?!?/strong>在國內從事大模型創業的李振看來,豆包深度思考內嵌入的聯網搜索功能,做法上更像是OpenAI推出的Deep Research,或者是Grok 3推出的DeepSearch功能。
這些DeepSearch類Agent的一大特征,就在于可以操控網絡瀏覽器獲取實時信息,從而具備自主執行簡單網絡任務的能力。
但人類的日常生活中,并非事事都需要開啟深度思考的Agent模式。豆包上述產品更新帶來的一大問題就在于,通過強制將聯網搜索嵌入深度思考過程,使得即便是面對簡單問題,也需要機械式地進行多輪搜索,在用戶體驗上造成一些不必要的等待過程。當字母榜詢問“今天北京天氣”時,豆包在做了四輪搜索后,才給出了答案。
不過,值得一提的是,通過減掉聯網搜索鍵,豆包在推動AI盡可能像人一樣去搜索問題、尋找答案上,給出了自己的新嘗試,某種程度上也相當于開始跟DeepSeek搶奪產品設計的定義權。
面對AI助手類產品越加越多的功能和按鍵,國內頭部大廠產品經理劉凱(化名)將其歸結為“抽象泄露”法則在AI領域的顯現。
“抽象泄漏”,多指在軟件開發時,本應隱藏實現細節的抽象化不可避免地暴露出底層細節與局限性,而抽象化本來目的就是向用戶隱藏不必要公開的細節。
體現在AI類產品設計中,“即用戶被迫理解不同的模型選擇,如基礎模型、推理模型的區別,以及勾選聯網搜索和深度思考功能與否的差異等,越來越背離理想中的無縫體驗?!眲P說道。
但上述現象正有望隨著模型迭代而改變。從Anthropic發布的全球首個混合模型Claude 3.7 Sonnet,到OpenAI CEO山姆·奧特曼預告中的大一統模型GPT-5,未來一個模型解決所有問題正逐漸成為共識,同樣,未來一個按鍵就解決所有用戶需求或許也將是產品演進的終局。
A
DeepSeek R1在年初爆火之后,聯網搜索由此成為一個新的按鍵,標配在一眾AI助手產品中。
最新(可能也是主流大模型公司中最后一家)選擇跟進的是Anthropic,其在近日宣布聊天機器人Claude即將啟用網絡搜索功能,打破了自身一直維持的“自給自足”設計理念,開始提供更多實時檢索信息,來回應用戶的需求呼喚。
R1之前,AI助手類產品中并沒有聯網搜索獨立按鍵的身影。
2022年底ChatGPT剛剛發布時,并不能進行聯網搜索,大模型所提供的信息截止到2021年7月份,也暫不具備從其經驗中學習的能力。
當2023年3月份百度文心一言發布后,其對外宣傳的產品亮點之一,便是引入了檢索增強(RAG)技術,在給模型補上獲取實時信息的短板之外,還可以起到幫助削弱模型幻覺的作用。
DeepSeek在R1推理模型上新設計的聯網搜索按鍵,則在此前檢索增強技術的基礎上,使得模型獲取網頁的數量和豐富度,進一步提高。同樣以查詢“今天北京天氣”為例,不開啟深度思考和聯網搜索,僅靠檢索增強支持的基礎模型,一般能夠檢索個位數的網頁鏈接,開啟聯網搜索后的深度思考模式下,模型獲取的網頁鏈接數量則飆升到數十個。
目前,根據DeepSeek給出的回答,其模型知識庫僅更新到2024年7月,所以在沒有勾選聯網搜索的情況下,面對“今天北京天氣”的詢問,R1會告訴用戶自己無法提供實時天氣數據,并建議用戶開啟聯網搜索功能。
之所以進入到推理模型后,大模型廠商才開始將聯網搜索拆分出來,單獨設計了一個新的按鍵,其首要原因便在于控制算力消耗成本。人工智能商業化專家丁坤博士告訴字母榜,深度思考功能本身調用的算力就更大,如果每次推理還要再進行一番聯網搜索,會將算力資源的消耗量推向新高。
R1爆火之后,英偉達創始人黃仁勛就對外多次強調,推理模型正在消耗更多的計算能力,“(推理模型)可以消耗100倍以上的計算資源,而未來的推理模型將消耗更多的計算資源?!?/p>
同時,考慮到當下大模型廠商C端的商業變現手段更多通過訂閱制,將深度思考和聯網搜索分開設計,也是出于一種商業化的考量,“分開設計有利于形成產品梯度,刺激用戶購買付費版本。”丁坤解釋道。
這一點在OpenAI、Anthropic和Grok上都有著直觀體現。盡管2月份后OpenAI向ChatGPT免費用戶也開放了推理功能,但卻從思考深度和思考次數上給出了限制。ChatGPT免費用戶只能使用o3-mini模型的推理能力,如果想體驗更強大的o1-Pro或o3-mini高性能版推理模型,則需要花費每月20美元或200美元,成為OpenAI的Plus或Pro付費訂閱用戶。
此外,從用戶體驗側考量,丁坤博士認為,深度思考和聯網搜索功能分開,則可以平衡用戶對生成答案更快和更好之間的需求。對于那些沒有時效性的問題,用戶便可以只勾選深度思考,從而更快獲取答案。
B
豆包一反行業常態,將聯網搜索和深度思考合二為一的背后,也有著自己的諸多考量。
國內頭部大廠產品經理劉凱(化名)向字母榜分析道,在產品增長中,內部往往會關注一個重要指標即用戶漏斗,其分為獲取、激活、留存、轉化變現四大階段。
在獲取新用戶上,國內外AI廠商都越來越看重“好奇流量”,“只要一個產品看起來有一些不一樣的神奇功能,或者哪怕沒有落地,還只是炫酷的演示Demo,就會吸引用戶快速嘗試?!眲P進一步指出,激發好奇流量的手段之一,便是對產品進行微優化。
有時候,一個很小的產品變化,也會大大提高AI產品的活躍用戶基數,例如去年憑借率先押注長文本出圈的Kimi,今年率先展示思維鏈的DeepSeek,它們都借助一次產品更新,在好奇流量的加持下,獲得了夢寐以求的病毒式傳播機會。
但并不是每一次產品更新,都能成功引來“好奇流量”。年初,晚于DeepSeek R1近兩天發布的豆包1.5 Pro大模型,盡管在預訓練和推理成本上還要低于DeepSeek V3,但卻因為模型體驗不如前者,而未能在輿論場上激起太多水花。
這次,豆包消滅聯網搜索的產品優化之舉,在過去一周左右時間后,也暫未迎來行業破圈效應。
但在國內一眾AI助手產品中,豆包又有著更迫切的規模增長需求。
DeepSeek爆火之前,豆包是中國月活用戶數最多的AI助手應用。在被DeepSeek趕超后,據晚點LatePost爆料,2月份的All Hands全員會上,字節CEO梁汝波列出了2025年的重點目標,其中之一便是要求團隊加強規模效應,繼續做大豆包用戶群。
QuestMobile向《財經》提供的數據顯示,截至3月4日,DeepSeek、豆包日活躍用戶分別是4885萬、2947萬。而梁汝波今年對豆包的DAU也提出了新目標,晚點LatePost報道中,今年豆包的 DAU 目標是超過 5000 萬。這意味著,在未來三個季度內,豆包日活用戶規模,差不多要翻一倍。
支撐豆包追求更大規模用戶,以及頂著算力消耗壓力將聯網搜索融入深度思考功能中的底氣之一,都離不開字節在GPU上的充裕儲備。
受益于推薦算法時期積累的芯片使用量,2023 年時,有媒體報道字節GPU儲備已超過10 萬塊;在外媒最新報道中,2025年字節AI算力采購預算將高達900 億元以上。
C
在豆包做出嘗試的功能融合方面,已經有大模型廠商選擇了跟進。
近期,百度通過“自研+開源模型”的組合,新上線了“自動模式”。該模式下,大模型能夠自動識別用戶需求,從而自主選擇合適模型來生成答案,在產品界面上,不僅不再展示聯網搜索鍵,連深度思考鍵也一并隱藏了起來。
在功能融合之前,一場圍繞模型的融合試驗,在過去一個月內已經頻繁上演。
3月25日,DeepSeek官宣V3版本更新。新版本V3-0324雖然不是推理模型,但卻有了一絲絲的R1味道。官方技術報告中透露,V3-0324和之前的V3使用的base模型相通,但改進了后訓練方法,并借鑒了R1推理模型訓練過程中的強化學習技術。
幾乎同一時期,騰訊新上線的混元T1正式版推理模型,則在保證內容精細和準確度的前提下,通過首次將混合Mamba架構無損應用于超大型推理模型,將快慢思考結合了起來,從而達到縮短用戶等待生成結果時間的效果。
不止國內,國外大模型公司也都在往模型融合統一的道路上邁進。
此前奧特曼在談及GPT-5的計劃時就曾經說道,模型和產品功能太復雜,未來OpenAI將實現統一,o3推理模型不再單獨發布,GPT-4.5也將是OpenAI最后一個非鏈式思維的基礎模型。
Anthropic更是搶先OpenAI一步,在2月底發布了“全球首個混合模型”Claude 3.7 Sonnet,在單一架構上整合了實時應答(Fast Thinking)和深度思考(Slow Thinking)。用戶不需要在不同的模型間進行切換,而是靠模型自行判斷當前問題是否需要深度思考。
未來,隨著模型回歸一統,在劉凱看來,模型載體之上的一系列功能按鍵,也有望回歸更加簡潔的設計,最終使得AI產品體驗無限趨近于人。
之所以當前階段一眾AI助手產品加入了五花八門的功能標簽,背后則是大模型產品用戶滲透率還比較低的現實困境。“大部分用戶還是抱著好奇心態,嘗鮮過后要么想不起來用,要么不知道打開后該問什么。”劉凱表示。
基于此,眼下的AI助手類產品,為了激發用戶的體驗熱情,往往會借鑒搜索引擎的設計理念,如向用戶推送彈窗消息,在輸入框下方主動設置一些供人點擊的新聞鏈接等。
除了用戶使用頻率不高之外,大模型技術尚未進入成熟穩定期,也是促使其產品功能標簽眾多的原因之一。
國內外的一眾大模型廠商,目前其實都是基于一個非確定性系統極高的模型來設計產品,這導致的一種情況是,大多數AI廠商以“模型思維來主導產品設計,而非應用思維?!?/strong>李振舉例稱,ChatGPT起初也只是為了展示OpenAI的模型能力而構建的,并不完全是為了打造一款面向消費者端的大眾應用。
就連奧特曼都在近期接受采訪時坦承,當時內部只是在以一個研究實驗室的標準來運行,根本沒有想過會成為一家消費科技公司。
但隨著模型普及教育的不斷深入,越來越多大模型廠商開始重視起核心用戶體驗,“這就是產品一步步更像人的演化過程?!崩钫窠忉尩馈?/p>
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.