99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

邊想邊搜、“看懂”世界,豆包深度思考模型能否打開AI Agent進化新維度?

0
分享至

每經記者:楊昕怡 每經編輯:余婷婷

解讀上市公司財報、填報高考志愿、為大家庭推薦露營裝備、拿著英文菜單給多人點餐——在4月17日的火山引擎AI創新巡展杭州站現場,這些復雜的工作、生活問題被搭載了最新深度思考模型的豆包一一解決。

發布會現場,火山引擎總裁譚待介紹稱,豆包1.5·深度思考模型在數學、編程、科學推理等專業領域及創意寫作等通用任務中表現突出,其中在數學推理AIME 2024測試得分追平了OpenAI o3-mini-high(模型名)。

如同OpenAI o系列最新模型o3和o4-mini(模型名)在多模態理解上的大力探索,豆包最新模型的多模態能力也在發布會現場被頻頻提及。“模型要有能力做好思考、計劃和反思,并且一定要支持多模態,就像人類具備視覺和聽覺一樣,Agent(智能體)才能更好地處理復雜任務。”譚待表示。

從OpenAI首款全功能Agent Operator到“一碼難求”的Manus(智能體名),AI(人工智能) Agent正在成為2025年業內的最大焦點。英諾天使基金合伙人王晟在今年年初接受《每日經濟新聞》記者專訪時表示,“AI這一波新技術的最終應用就是Agent,我們今年比較期待AI Agent能取得突破。”


火山引擎總裁 譚待 圖片來源:火山引擎公眾號

為了加速Agent的落地,火山引擎此次還推出了OS Agent解決方案及AI云原生推理套件。“持續優化模型,保持競爭力;不斷降低成本、延遲,提高吞吐率;讓產品更易落地,(發布)像扣子、HiAgent平臺還有云原生組件OS Agent等——未來我們會在這三方面持續發力。”在會后的群訪中,譚待向《每日經濟新聞》記者表示。

“多模態+深度推理”,豆包上線全新模型

對于一個新模型而言,其性能自然是外界關注的首要方面。發布會上,譚待介紹稱,豆包1.5·深度思考模型在數學推理AIME 2024測試的得分追平OpenAI o3-mini-high,編程競賽和科學推理測試成績接近o1。同時,在創意寫作、人文知識問答等非推理任務上,該模型也展現出了優秀的泛化能力。

技術報告顯示,這一新模型采用MoE(專家混合模型)架構,總參數為200B,激活參數僅20B,低于業界同類模型參數規模的50%,具備顯著的推理成本優勢。并且,基于高效算法,該模型API服務能在保障高并發的同時,實現20毫秒的極低延遲。

在具體的場景應用上,豆包1.5·深度思考模型主要突出了自身具備的邊想邊搜能力和視覺版的多模態能力。

“計劃從北京出發,去日本關西地區進行為期5天的旅游,希望能看到花火大會、泡到特色溫泉,請幫我規劃一下行程。”《每日經濟新聞》記者以上述提示詞實測發現,豆包在思考過程中能自主拆解問題,就花火大會日期、溫泉旅館的預訂情況和交通券的適用范圍等信息確認進行了多輪搜索。

“除了邊搜邊想,豆包深度思考模型還具備視覺推理能力,讓模型像人類一樣,不光基于文字思考,更能基于所見畫面來思考,更加全面。”譚待在發布會上舉例表示,“豆包深度思考模型可以看懂非常復雜的企業項目管理流程圖表,能快速定位到關鍵信息,并以強大的指令遵循能力,嚴格按照流程圖,回答客戶的問題。”

北京市社會科學院副研究員王鵬接受《每日經濟新聞》記者微信采訪時表示,具備多模態能力是未來推理模型的趨勢,“多模態能力使模型更全面理解和處理復雜信息,能廣泛應用于金融、智能客服和醫療等領域。”

截至目前,豆包大模型家族已有15位“成員”,豆包App也成為了國內AI原生App的頭部玩家。據QuestMobile在4月15日發布的數據顯示,截至2025年2月底,我國AI原生App用戶規模達2.4億,較1月份增長了1.15億。2025年3月,豆包的月活用戶規模達1.16億,僅次于DeepSeek的1.94億。

“Agent是必經之路”,火山引擎如何助力?

發布會上,譚待還照例公布了豆包大模型的最新使用量:截至2025年3月,豆包大模型日均tokens(詞元)使用量超12.7萬億,較發布之初增長超106倍。

與此同時,國際數據公司IDC在今年4月發布的《中國公有云大模型服務市場格局分析,1Q25》(注:1Q25指2025年第一季度)顯示,2024年我國公有云上大模型調用量達114.2萬億tokens,其中火山引擎以46.4%的市場份額位居第一。

對于超百倍的增長,譚待向《每日經濟新聞》記者表示,從長期來看,火山引擎的大模型token調用量在未來仍有百倍甚至更高增長的可能,“具體需要多久時間,關鍵取決于模型是否有重大突破。”

“去年到今年增長很快是因為模型有幾大突破:一是基礎聊天和信息處理能力的提升及成本下降,二是今年深度思考功能的推出。”譚待認為,之后大模型的迭代還將迎來多個關鍵節點,“例如視覺推理能否做得更好、Agent相關技術能否取得更大進展等。”

在譚待看來,要讓AI真正為各行各業帶來變革,Agent是必經之路,“關于Agent的定義,能完成打油詩、簡單報告等任務的不能稱為Agent。從定性角度來看,Agent應該要能完成專業度較高、耗時較長的完整任務;從技術實現角度來看,如果沒有運用思考模型,缺乏反思和規劃能力,也很難被認定為Agent。”

為了加速Agent的落地,此次發布會上,火山引擎宣布了OS Agent解決方案的推出,包含了豆包UI-TARS模型,以及veFaaS函數服務、云服務器、云手機等產品。

記者注意到,4月17日,豆包大模型團隊發布并開源了基于UI-TARS進行增強的UI-TARS-1.5,目前已在7個典型的GUI(圖形用戶界面)評測基準中取得SOTA(最先進的)表現,還首次展現了其在游戲中的長時推理能力和在開放空間中的交互能力。

近期,Claude母公司Anthropic推出的MCP(模型上下文協議)成為了國內外頭部廠商的一大關注點,阿里云、騰訊云等云廠商紛紛上線MCP服務。群訪中,譚待表示,火山引擎已經支持MCP,“我覺得協議統一很重要”,“如果能做到統一協議,大家的應用開發就會更快,模型調用也會更智能。”

“我們一直致力于成為AI時代最優秀的云廠商。”譚待表示,“只要保持產品和技術領先,市場份額自然會領先。”

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
一敗涂地的特朗普向中方跪了,簽署“認慫令”,公開向中國認錯

一敗涂地的特朗普向中方跪了,簽署“認慫令”,公開向中國認錯

說天說地說實事
2025-05-04 09:37:17
可能有毒!空氣炸鍋、烤箱用的紙,別亂買……

可能有毒!空氣炸鍋、烤箱用的紙,別亂買……

焦作日報
2025-05-03 20:09:47
特殊時期時,林彪曾私下里講過:劉少奇、鄧小平全是有能力的好人

特殊時期時,林彪曾私下里講過:劉少奇、鄧小平全是有能力的好人

丹寶說文史
2023-06-10 14:55:24
誰說她又胖又丑的?這不挺好看,挺瘦的,還有點像整之前的孫菲菲

誰說她又胖又丑的?這不挺好看,挺瘦的,還有點像整之前的孫菲菲

逍遙史記
2025-05-04 10:31:30
1位NBA內部人士詳細分析了快船隊哈登,在季后賽生涯中的種種不足

1位NBA內部人士詳細分析了快船隊哈登,在季后賽生涯中的種種不足

好火子
2025-05-05 02:34:32
最終沒翻船!皇馬對塞爾塔已11連勝,下輪輸給巴薩也不會讓對手提前奪冠

最終沒翻船!皇馬對塞爾塔已11連勝,下輪輸給巴薩也不會讓對手提前奪冠

雷速體育
2025-05-04 22:49:18
古力娜扎穿透視裙,懟著鏡頭硬拍,這實力不簡單

古力娜扎穿透視裙,懟著鏡頭硬拍,這實力不簡單

星辰生肖館
2025-04-16 11:04:23
新加坡總理夫人參加投票,穿黑T恤配灰裙超秀氣,有宋慧喬的氣質

新加坡總理夫人參加投票,穿黑T恤配灰裙超秀氣,有宋慧喬的氣質

基斯默默
2025-05-04 00:04:26
百米飛人博爾特現狀:退役6年生3個孩子,每年400萬美元領一輩子

百米飛人博爾特現狀:退役6年生3個孩子,每年400萬美元領一輩子

煙潯渺渺
2025-05-04 10:54:29
曝馬筱梅早期照片,長相差異大,汪小菲被群嘲,博主暗指S媽操控

曝馬筱梅早期照片,長相差異大,汪小菲被群嘲,博主暗指S媽操控

阿廢冷眼觀察所
2025-05-05 00:12:45
這部被名字耽誤的下飯神劇也太好看了,一刷就停不下來

這部被名字耽誤的下飯神劇也太好看了,一刷就停不下來

TVB的四小花
2025-05-05 06:22:50
利物浦奪冠后首戰告負!4年首負切爾西,3大紀錄告破,名記開炮

利物浦奪冠后首戰告負!4年首負切爾西,3大紀錄告破,名記開炮

奧拜爾
2025-05-05 01:29:54
上海宣布:開通3條應急線路!高速堵成停車場?有腦溢血患者緊急求助,救援啟動→

上海宣布:開通3條應急線路!高速堵成停車場?有腦溢血患者緊急求助,救援啟動→

上觀新聞
2025-05-04 19:30:34
河北小伙五一來北京舅舅家做客,看到舅媽做的菜惱了:下次不來了

河北小伙五一來北京舅舅家做客,看到舅媽做的菜惱了:下次不來了

阿龍美食記
2025-05-04 15:15:46
偶遇44歲全智賢真實容顏,皺紋明顯有下垂有發腮,女神有年齡感了

偶遇44歲全智賢真實容顏,皺紋明顯有下垂有發腮,女神有年齡感了

阿鳧愛吐槽
2025-05-04 22:58:59
越南工廠恐慌蔓延:客戶已開始撤單,等90天有何用?

越南工廠恐慌蔓延:客戶已開始撤單,等90天有何用?

觀察者網
2025-05-04 18:24:05
李小璐霍思燕一家連續兩天外出!賈乃亮給她們買咖啡,相處很和諧

李小璐霍思燕一家連續兩天外出!賈乃亮給她們買咖啡,相處很和諧

鑫鑫說說
2025-05-04 14:06:36
當年舉報畢福劍的告密者如今啥樣了?眾叛親離,過得好慘!

當年舉報畢福劍的告密者如今啥樣了?眾叛親離,過得好慘!

華人星光
2024-12-14 11:20:20
韓國餃子被連夜踢出中國超市,這場文化反擊戰,中國干得漂亮!

韓國餃子被連夜踢出中國超市,這場文化反擊戰,中國干得漂亮!

安珈使者啊
2025-05-01 06:50:05
孫子在炕上午睡,奶奶打了一天麻將才想起回家,打開門她差點昏過去

孫子在炕上午睡,奶奶打了一天麻將才想起回家,打開門她差點昏過去

瓜哥的動物日記
2025-05-05 04:09:02
2025-05-05 07:47:00
每日經濟新聞 incentive-icons
每日經濟新聞
中國主流財經全媒體平臺。
1232014文章數 2713261關注度
往期回顧 全部

科技要聞

巴菲特:理性看待AI炒作 耐心是關鍵

頭條要聞

于東來:若網紅"柴懟懟"不受罰 我將關閉胖東來

頭條要聞

于東來:若網紅"柴懟懟"不受罰 我將關閉胖東來

體育要聞

首冠到手!凱恩秒慶祝 德甲官方:不負追光之人

娛樂要聞

55歲王菲跟“李亞鵬時期”完全不同!

財經要聞

一個時代的結束!巴菲特年底將卸任

汽車要聞

小米SU7大優惠!5月限時購車權益送輔助駕駛

態度原創

藝術
家居
健康
手機
公開課

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

家居要聞

黑白紋理 簡約低調空間

唇皰疹和口腔潰瘍是"同伙"嗎?

手機要聞

曝蘋果正在開發20周年紀念版iPhone

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 四子王旗| 正定县| 凤庆县| 达日县| 岳普湖县| 邓州市| 日喀则市| 新疆| 绥芬河市| 密山市| 阳山县| 香港 | 许昌市| 兴义市| 凉山| 和平县| 锦屏县| 都安| 靖远县| 澎湖县| 宜川县| 华蓥市| 济南市| 武乡县| 且末县| 高青县| 志丹县| 鸡东县| 河源市| 唐山市| 景德镇市| 玉龙| 宁都县| 闻喜县| 德阳市| 济南市| 美姑县| 海兴县| 武穴市| 伊吾县| 安义县|