網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

羨慕o3？豆包也可以進行圖片推理了！

2025-04-17 19:30:23　來源: 歸藏的AI工具箱

北京舉報

分享至

昨天 Open AI 發(fā)布 o3 之后，早上嘗試的的時候被 OpenAI 的降智快要折磨的砸電腦了。

剛好字節(jié)給開放了今天發(fā)布的豆包1.5深度思考模型，包含一個語言模型Doubao-1.5-thinking-pro，還有一個視覺版Doubao-1.5-thinking-pro-vision使用權(quán)限。

順手用一些案例測試了一下，結(jié)果發(fā)現(xiàn)這倆玩意相當可以啊。

語言模型作為一個總大小 200B 激活參數(shù) 20B 的 MoE 模型，從規(guī)模上差 o3 很遠。

但是 o3 可以完成的一些日常任務(wù)，Doubao-1.5-thinking-pro在給了一些提示后都能完成而且完成的不錯。

這要再整個規(guī)模大點的模型，又可以不受 Open AI 的氣了。更令人好奇的是視覺版Doubao-1.5-thinking-pro-vision，目前還沒披露詳細的技術(shù)報告。

我們還是來看一下測試結(jié)果。

根據(jù)照片推理位置

o3 最著名的一個用例就是根據(jù)圖片推論圖片拍攝的位置，我從小紅書找了一個徒步路線的圖片，想試試豆包模型能不能搞定，這是河北的易水湖景區(qū)，沒想到真的可以，離譜了。

發(fā)給豆包模型之后他根據(jù)湖水、植被類型、山脈特征判斷大致位置，之后有根據(jù)我的徒步路線這個信息思考了華北的類似區(qū)域和徒步路線最后確定了徒步線路的位置。

后面根據(jù)這個信息給出了這條路線的詳細信息，還有徒步需要準備的東西和注意事項。

根據(jù)冰箱內(nèi)容定制食譜

是不是想減肥但不知道每天應(yīng)該怎么吃，Doubao-1.5-thinking-pro-vision 幫你識別冰箱中的所有食物并且結(jié)合你的身高、體重和運動量量確定每天的三大營養(yǎng)素攝入指標，身為你定制減肥食譜。

他還會提醒你冰箱里哪些需要少吃，另外會推薦最優(yōu)的方案，也可以提供了冰箱食物的替代版本。

根據(jù)照片判斷車禍原因和責任

很多朋友可能喜歡看車禍事故視頻下飯或者自己開車不好判斷事故責任問題，我們在小紅書找一個撞車事故的圖片，看看豆包模型能不能猜出事故的原因。

我本來不報期望的，因為這個圖片的信息太少了，紅綠燈之類的都沒有，但是豆包模型還是基于兩車接觸位置和摔倒的姿態(tài)判斷出了車禍的原因，就是因為視野盲區(qū)加車主沒注意撞了摩托車，說明圖片信息真的參與了推理過程。

育兒家居改造建議

豆包這個視覺思考模型視覺版也支持多張圖片進行推理。

這里我上傳了一個房子不同房間和角度的照片，讓豆包給出可以為孩子降生做的家裝整改建議。

他分析了現(xiàn)在屋子的陳設(shè)以后先是給出了一些針對安全的建議，后面針對方便育兒給出的物品陳列和擺放建議也很實用，還設(shè)計了安全防護 + 動線便利 + 彈性收納三步走的調(diào)整策略，非常條理。

AI 編程和多模態(tài)就是今年最重要的兩條主線敘事，Open AI 靠著在多模態(tài)和生成上的爆發(fā)在今年繼續(xù)站穩(wěn)了自己的位置。

而且無論是視覺推理還是多模態(tài)圖片生成都是非常前沿的結(jié)果。

不得不說字節(jié)真的很有前瞻性，豆包文生圖Seedream3.0（即夢3.0接入的模型）和豆包Doubao-1.5-thinking-pro-vison在這兩個層面都在發(fā)力，現(xiàn)在也有了一些不錯的成果。

我們有理由相信他們會是國內(nèi)最快能夠追上 Open AI 在這兩個層面進度的公司。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

成本降95%性能超ES9.0，OceanBase推GPU加速的向量數(shù)據(jù)庫

智東西 2025-06-24 22:48:07
0 跟貼 0
一句話讓DeepSeek控制你的電腦！微軟開源神器OmniParser V2

量子位 2025-02-18 20:48:36
0 跟貼 0

老板想本地跑AI，只給10萬還想體驗滿血DS，我該咋辦？

量子位 2025-04-14 15:31:01
0 跟貼 0

你給豆包打的這通視頻背后，藏著AI實時交互的體驗密碼

智東西 2025-06-25 20:04:47
0 跟貼 0
谷歌首個！機器人有了“離線大腦”，沒網(wǎng)也能干活

機器之心Pro 2025-06-25 19:36:06
0 跟貼 0

騰訊混元圖像2.0一手實測，毫秒級響應(yīng)

量子位 2025-05-18 12:49:08
0 跟貼 0

谷歌I/O大會放狠招，終極AI助手已來

機器之心Pro 2025-05-21 13:09:12
0 跟貼 0
科大訊飛：AI孫悟空用日語回答日本老爺爺?shù)奶釂?/a>

智東西 2025-04-18 23:31:04
0 跟貼 0

巧用DeepSeek構(gòu)建多元資產(chǎn)配置框架！“最會用AI做研究的策略首席”王開教你”新套路”

華爾街見聞官方 2025-06-25 20:28:08
0 跟貼 0
垂直小模型精準補位，MVP驗證成本更低更高效了

量子位 2025-04-21 14:49:47
0 跟貼 0
3mm超薄「隨身AI大腦」來了！全球首個Agentic神器讓打工人瘋狂種草

新智元 2025-06-25 20:11:19
0 跟貼 0
對話智識神工楚慶：AI必須創(chuàng)造新生產(chǎn)力，否則就是一場昂貴的幻覺

通信世界 2025-06-25 20:14:37
0 跟貼 0
618失速：當電商進入“康波周期”的瓶頸期

經(jīng)濟觀察報 2025-06-23 13:30:23
1 跟貼 1
小鵬絕地翻盤，頭號功臣是她！

華商韜略 2025-03-28 14:19:16
13 跟貼 13
小米要做中國家電前三，和美的相互學(xué)習(xí)

每日經(jīng)濟新聞 2025-05-19 23:45:08
443 跟貼 443
抽象年輕人的“不體面”旅拍，為何成了抖音、小紅書新潮流？

人人都是產(chǎn)品經(jīng)理社區(qū) 2025-06-22 10:04:45
0 跟貼 0
特朗普試駕特斯拉，上車姿勢被模仿，一舉一動都是教材！

樂活趣事件 2025-06-23 11:09:19
2 跟貼 2
34歲，在小紅書做手工博主月入五位數(shù)，喜歡DIY的都來學(xué)她！

廈九九Joy 2025-06-21 19:34:37
1 跟貼 1
在小紅書賣定制西裝，百粉變現(xiàn)5位數(shù)，有產(chǎn)品你就來！

廈九九Joy 2025-06-22 19:35:28
1 跟貼 1
UPPER VOID 創(chuàng)始人：新品牌賣貴要給足感性價值丨晚點周末

晚點LatePost 2025-06-22 20:25:53
5 跟貼 5
靜悄悄的餓了么，戰(zhàn)斗力到底有多強？

華商韜略 2025-04-30 14:18:35
0 跟貼 0
南都電商觀察｜中消協(xié)談抵制極端吃播；小紅書治理房產(chǎn)營銷號

南方都市報 2025-06-25 12:16:20
0 跟貼 0
比亞迪李云飛：要忙在正道上，拒絕陰陽

每日經(jīng)濟新聞 2025-06-06 17:55:12
0 跟貼 0
比亞迪版圖大起底，實力超乎你的想象

華商韜略 2025-02-11 17:11:11
123 跟貼 123
牛彈琴：以伊激戰(zhàn)12天打成喜劇當事三國都認為贏麻了

大象新聞 2025-06-25 08:02:49
19006 跟貼 19006
港大等開源GoT-R1：強化學(xué)習(xí)解鎖視覺生成推理新范式

機器之心Pro 2025-06-25 17:49:23
0 跟貼 0
《如鳶》玩家自制辟謠視頻，集體發(fā)聲讓“真相”被更多人看見

游戲日報 2025-06-25 20:02:59
0 跟貼 0
金正恩曝光新款豪車！奔馳公司明明禁止出口，朝鮮是如何進口的？

用冷眼洞悉世界 2025-06-24 01:29:26
0 跟貼 0
吉利控股副總裁楊學(xué)良：長城汽車魏建軍是行業(yè)吹哨人

每日經(jīng)濟新聞 2025-06-07 16:30:19
150 跟貼 150
推理越多，幻覺越重？多模態(tài)推理模型的「幻覺悖論」

新智元 2025-06-25 20:06:49
0 跟貼 0
行業(yè)都在卷，貝殼為啥不著急？

華商韜略 2025-06-24 10:49:53
0 跟貼 0
字節(jié)跳動HR策略深度解析張一鳴敢招比自己強的人

網(wǎng)界 2025-06-25 12:30:07
2 跟貼 2
字節(jié)跳動：豆包大模型團隊前員工嚴重違反制度，已辭退

21世紀經(jīng)濟報道 2025-06-25 09:48:33
4 跟貼 4
小米要把誰擠出家電行業(yè)前三？盧偉冰：美的和海爾非常優(yōu)秀，他們都是有格局的企業(yè)家

藍鯨新聞 2025-06-22 11:05:52
1 跟貼 1
OpenAI硬件被指抄襲，奧特曼和蘋果設(shè)計師Jony Ive陷入抄襲門！

量子位 2025-06-24 21:40:03
0 跟貼 0
2025企業(yè)用AI，就像我們玩智能手機一樣簡單？

科技向令說 2025-06-23 13:10:02
3 跟貼 3
理想汽車李想：我們比傳統(tǒng)汽車廠商更懂大型軟件

每日經(jīng)濟新聞 2025-03-29 12:03:06
50 跟貼 50
昔日地方臺主持人跑外賣：“成為秒送小哥，并不是降級”

極目新聞 2025-06-25 10:54:22
12 跟貼 12
豆包1.5·深度思考模型上線(2)

機器之心Pro 2025-04-17 19:53:58
0 跟貼 0
黃金界愛馬仕，老鋪黃金憑啥爆火？

華商韜略 2025-05-07 16:05:00
0 跟貼 0

手機 / 數(shù)碼

房產(chǎn) / 家居

羨慕o3？豆包也可以進行圖片推理了！

小米YU7已下線500輛展車 26日前運往全國

山西太原大媽，在NBA闖出一片天

向佐接機郭碧婷，全程無交流像陌生人

免除蘇寧易購5億債務(wù)的神秘人是誰？

售14.99萬/限量200臺 別克昂科威S新增丹霞紅內(nèi)飾

態(tài)度原創(chuàng)

三亞頂豪！內(nèi)部資料曝光！

故宮珍藏的墨跡《十七帖》，比拓本更精良，這才是地道的魏晉寫法

打開京東搜“小米新品0626” 有機會搶先體驗小米AI眼鏡

伊朗總統(tǒng)：12天戰(zhàn)爭結(jié)束 重建工作開啟

售14.99萬/限量200臺別克昂科威S新增丹霞紅內(nèi)飾

伊朗總統(tǒng)：12天戰(zhàn)爭結(jié)束重建工作開啟