99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

<blockquote id="jo3uf"><i id="jo3uf"><video id="jo3uf"></video></i></blockquote>

<cite id="jo3uf"><rp id="jo3uf"><form id="jo3uf"></form></rp></cite>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

開天眼的豆包來勢洶洶

2025-05-30 12:50:45　來源: 智遠同學

北京舉報

0

分享至

文：王智遠 | ID:Z201440

去年火山引擎大會上，豆包團隊展示一項功能：

用攝像頭對準一個物體提問，AI能實時作答。當時看完演示視頻，我有一個念頭：如果做成了，AI 真的「長」眼睛了。

但這類技術從演示到落地，需要時間。畢竟，理解真實世界的視覺信息，遠比生成文字或圖像復雜得多；過去大半年我一直關注進展，直到上周六，終于上線了：視頻通話功能。

多數人把它當作新奇玩意兒，用來玩梗、搞笑。我認為，這是一個技術拐點，它會在商業世界里引發一系列新的想象。

01

可以先思考一個問題：視覺理解跟傳統的圖像識別，有什么本質不同？可能有三點關鍵差異。

首先，技術從“標簽化”走向“語義化”。

以前圖像識別，是一個巨型分類器。你給它一張圖，它能告訴你這是貓、那是蘋果，僅此而已，它的邏輯，靠大量打標簽的數據訓練出來的。

看到某種像素組合，就知道對應哪個對象，但它不理解貓為什么會在這兒，也不知道蘋果放在廚房和實驗室意味著什么。

語義化不一樣。當看到一張“貓躺在沙發上的照片”，AI要識別出貓和沙發這兩個元素，還要理解「躺著」的狀態、「沙發」這個環境，甚至推測這是一個安靜的家庭場景：貓在休息，家里沒人打擾。

它開始解析背后的“故事”，進行推理和常識判斷。這種能力怎么實現的呢？

表面上看，是多模態大模型的突破。傳統圖像識別只能處理圖像，是單模態系統。豆包這次的能力，是建立在一個既能看懂圖像、又能理解語言的大模型之上。

這意味著 AI 不僅能看到，還能調用知識庫，把畫面翻譯成語言，再進一步分析思考。但這還不是全部，它還有兩個關鍵能力：實時交互和上下文理解。

傳統圖片、拍照對話，三四輪就結束了，豆包是實時的、連續的、可追問的。你可以一邊對著畫面提問，一邊不斷深入，聊到你煩了為止，這對用戶體驗來說，是個質的飛躍。

第三點最值得關注：它已經顯現出「具身智能」的雛形。

什么叫具身智能？簡單講，AI 沒有實體，但可以通過攝像頭感知外部世界，并作出反應。

它不再是那種被動等你下指令的工具，而是一個能看、會想、還能回應的智能體——把圖像、語言和邏輯整合在一起，開始具備類似人類的感知能力。

所以我說，這種對真實世界的“感知”能力，是 AI 走向更高階智能形態的關鍵一步。

02

讓AI看到東西，還能回答問題，聽起來像開掛，背后卻藏著一堆技術難題。什么難題呢？

講技術，太干巴了，跟你講個故事：

你生過孩子嗎？生過，更好；沒有，也不要緊張。至少見過剛出生的嬰兒吧，他一睜眼，世界就在面前了，哇哇的哭，看起來特別可愛。

不過，他能「看見」，卻什么都「不懂」；你指著一個杯子說：這是杯子。他眨眨眼，腦子里壓根沒建立起聲音、圖像和意義之間的聯系。

AI也是一樣。它不是不會看，而是看得見但看不懂。豆包這次上線的能力，不是加了個攝像頭讓它多認幾個字，是讓它完成了一次真正的「認知成長」。

就像嬰兒一樣，AI也得一步步來，第一步：先學會「眼睛和耳朵對得上」，把「看到的畫面」和「聽到的語言」真正連接起來。

它看到一張圖里有人在笑，你問它：他在干嘛？它識別出「嘴巴張開了」后，還得知道「張開嘴巴+眼角彎彎=笑」，然后才能說：他在笑。

所以，這跟嬰兒第一次聽到「笑」這個詞，再看到大人笑的樣子一樣，慢慢把信號對在一起。

對在一起，然后呢？還得反應快，還要會想。

要知道，我們不是來看AI做作業的，是來問問題的。你不可能等它慢慢分析完再來回答你；它得一邊看，一邊聽，一邊想，三件事同步進行，而且還要說得準。

好像那個長大的孩子，你指著一個東西問他：這是啥？；他不用翻字典，就能立刻告訴你答案，甚至還能補一句：我記得上次你也用過它。

有了反應還不夠，還要能猜出來。怎么猜？

現實世界哪有什么標準答案？拍一張照片，光線暗、角度怪、遮擋多，AI得在這種混亂中找出線索。你還可以指著一個它沒學過的工具問：“這是干啥用的？”

這時候，不能只會說“我不認識”，得靠自己推理出一個合理的答案。

孩子長大了，你帶他去工地，他沒見過某個零件，但他能根據它的形狀、位置、顏色，猜出它可能是用來擰螺絲的。這才是真正的「看懂」。

所以，長眼睛和開天眼，不一樣；一個是具備某個能力，一個是把看、聽、說串聯在一起。它像人一樣，經歷從「看得到」到「看得懂」的成長過程，這一層一層的認知升級，才有機會理解人類的世界。

03

既然AI能「看懂」物理世界，那麻煩來了。比如：會不會改變熟悉的行業？又會催生哪些新的商業模式？

說點近距離的。辦公場景中，很多人面對屏幕時，除了看文字、圖表、設計圖、還有代碼界面等等。

當你看到一段K線圖搞不懂時，只要共享一下屏幕，AI能幫你分析走勢，告訴你是漲還是跌；再比如寫文章卡殼了，靈感沒了，怎么辦？拿出手機對著屏幕一拍，AI能根據你寫的內容提供建議。

這種能力，會催生一種新服務模式：我把它叫做「屏幕即服務」。

當然，未來真正值得關注的是教育、醫療這兩個對“理解”要求很高的行業。

你想，孩子做題時突然卡住了，問誰呢？以后，他可以直接指著題目說：幫我看看這道題怎么解？AI能一邊看題，一邊聽問題，然后，用語音告訴你思路。

那醫生呢？

以前看CT片要花很多時間，醫生找角度，反復對比。以后是不是只要拿手機一拍，AI能立刻告訴你有沒有異常？有沒有結節？有沒有早期跡象？效率提升的不只是幾倍，而是幾十倍。

再來看零售。

現在購物體驗，最多是拍照搜同款。未來，你打開攝像頭，對準感興趣的商品，馬上知道這是什么品牌、多少錢、評價怎么樣，甚至直接跳轉購買鏈接。

走在大街上，看到櫥窗里的衣服，朋友戴的首飾，雜志上的推薦單品；只要對著它們一拍，信息立馬浮現出來，這不是科幻，是正在發生的現實。

而且，這種能力還會催生一個新的趨勢：即時興趣到即時購買；用戶從“感興趣”到“下單”，中間不再需要復雜的流程，決策路徑被大大縮短了。

再進一步，智能導購、門店運營也會發生根本性變化。

想象一下，未來的門店里裝上了AI攝像頭，它能實時觀察顧客的行為：他在哪個商品前停留了多久？對哪類首飾特別關注？有沒有反復回頭看？有沒有皺眉、猶豫？

這些細節，AI都能捕捉到，并據此判斷顧客的興趣偏好；同時，商家也能通過AI視覺分析客流熱點、動線軌跡、商品陳列效果，從而不斷優化門店布局和服務策略。

再來看看制造業。

過去很多工廠靠人工巡檢，靠經驗判斷良品率。但人眼總有盲區，疲勞也會影響判斷；未來，AI攝像頭可以自動監控生產線，識別表面瑕疵、零件錯位、顏色偏差等問題。

這樣不僅能看得更細，還能記得更多，形成數據反饋閉環，幫助工廠實現真正的智能化管理。

除了這些，還有很多我沒想到的場景。可以說，這項能力帶來感知世界方式的一次躍遷。它讓我們重新思考：該如何與世界交互？又該如何在此基礎上創造新的商業價值？

04

來勢洶洶的豆包，會不會卷到阿里、騰訊、百度？

肯定會。

背后站著字節，這家公司在理解用戶需求、打造爆款產品、快速迭代的能力上，毋庸置疑；

作為它的AI旗艦應用，天然具備兩個關鍵優勢：一能快速獲取海量用戶的反饋數據；二有「用戶工廠」的基因，擅長用數據驅動產品創新。

所以你看，現在“天眼”雖然裝在豆包里，但以后未必只出現在這一個產品上；它可能很快會被復制到抖音、甚至投資的其他項目里，比如：AI眼鏡、智能終端等等。

你可以想象一下：只要有一個設備能搭載AI視覺能力，它就能「看見」一切；再加上它本身強大的知識問答能力，這就意味著：AI不再只是個工具，而是真正走向了「全民助手」的階段。

再來看看，其他大廠相比，到底有什么不同？

夸克也在做AI視覺相關的功能，拍照搜題、搜同款商品，目前更像「搜索+AI」的路線；核心優勢是信息檢索能力，擅長從海量數據中快速找到匹配的內容，就像一位經驗豐富的圖書管理員。

豆包是從大模型和多模態能力切入的，強調「看懂」畫面背后的含義，還能推理、解釋、互動；更像一個「看得見、聽得懂、會思考」的私人導師。

我認為，兩者各有優勢，在AI視覺這條賽道上，誰也替代不了誰，形成了良好的互補。

再來看騰訊元寶。這款產品在上線初期吸引大量用戶關注，但從公開討論來看，用戶留存率還有待提升。

一方面，大模型「幻覺」問題還沒有完全解決，影響了實際使用體驗；另一方面，當前，交互方式還停留在傳統的二維界面操作，缺乏「像人一樣對話」的智能體式交互。

相比之下，豆包有點「IP角色」的感覺，在桌面端可以隨時調用、自由交互。這種體驗上的差異，也是影響用戶性的重要因素。

對了，前幾天，我還刷到騰訊張軍的視頻號，他也發了一條元寶「開天眼」的視頻，我還點了個贊，相信這一切，也很快要來了。

至于百度文小言，今年，我也看到它在視頻生成模型上的突破，開源是好事，但實際APP上，還要更多時間去打磨，比如：它的視頻通話要拍照才可以識別。

通義千問APP視頻通話，現在已經悄悄增加了一個「預約體驗」入口，看來也在摩拳擦掌。

盡管豆包視覺模型來勢洶洶，它要真正建立起長期優勢，也不是一蹴而就的事。有兩個關鍵點值得持續關注：

一，AI再聰明，也離不開高質量、多樣化的數據喂養。如何在合規前提下，收集更多有助于多模態訓練的數據，是所有廠商都面臨的問題。

二，真正的行業融合

把它作為一個解題工具，價值太有限了，要想真正跑贏別人，得把能力嵌入到教育、醫療、制造等行業中去，成為行業變革的一部分。

所以，豆包這次的「開天眼」，意味著AI正在從「被動響應」走向「主動感知」，從「工具走向助手」。

接下來誰能走得更遠，拼的不只是技術，更是數據、場景、生態的全面布局，對了，還有用戶體驗。希望其他巨頭們，盡快跟上這場「視覺革命」。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

AI說書媲美真人！豆包語音大模型升級長上下文理解

量子位 2025-02-26 15:23:35
0 跟貼 0
CVPR 2025 多模態大一統：斯坦福 x 復旦符號主義建模生成式任務

機器之心Pro 2025-06-13 10:11:44
0 跟貼 0

OpenAI發布ChatGPT Agent：AI"代理人"已至，人類準備好交出操作權了嗎？

鈦媒體APP 2025-07-18 12:44:12
0 跟貼 0

AI大神卡帕西投錢！全球首個直播生成模型發布，實時生成無時長限制

智東西 2025-07-19 12:16:46
0 跟貼 0
AI不止會聊天，還會陪你逛展！WAIC帶你揭秘四大展館暗藏科技彩蛋！

鈦媒體APP 2025-07-18 18:23:17
0 跟貼 0

垂直小模型精準補位，MVP驗證成本更低更高效了

量子位 2025-04-21 14:49:47
0 跟貼 0

Karpathy都投的AI實時視頻生成模型：直播立即轉，無限時長零延遲

量子位 2025-07-19 14:01:54
0 跟貼 0
代碼碾壓一切！OpenAI神秘模型o3-alpha一夜刷屏，卻遭41歲大神絕地反殺

新智元 2025-07-19 14:12:17
0 跟貼 0

Windsurf驚魂96小時！AI閃電并購戰：谷歌天價挖人，Cognition逆襲接盤

新智元 2025-07-19 14:05:26
0 跟貼 0
超算互聯網上線開源AI社區！模型+數據+算力，一站式解決

量子位 2025-06-23 20:07:47
0 跟貼 0
用豆包做數據分析是種什么體驗？用過的人都停不下來

秋葉excel 2025-07-18 11:43:39
0 跟貼 0
改LOGO玩“自黑”！叛逆設計師的反向操作

設計癖 2025-07-19 12:13:33
1 跟貼 1
在天眼面前，無處可藏

旅行影視 2025-07-17 12:25:47
1 跟貼 1
以大地作畫布，藝術家創作絕美視覺盛宴，網友：最難的應該是比例把控

重慶觀天下 2025-07-15 19:44:07
0 跟貼 0
a貓咪咋感知主人更換？靠嗅聽視覺！適應新主還得這么做！

生活是一幅畫 2025-07-19 04:55:09
0 跟貼 0
豆包1.5·深度思考模型上線(2)

機器之心Pro 2025-04-17 19:53:58
0 跟貼 0
桑勝月：請做我的朋友

上觀新聞 2025-07-15 07:32:16
1 跟貼 1
網絡上最奇怪的10個生物，有的長相完全超脫認知，挑戰你的視覺

小勇自駕野外生存 2025-07-18 09:54:51
0 跟貼 0
r狗狗視力能看多遠？這些秘密你可能第一次知道

生活是一幅畫 2025-07-19 04:05:17
0 跟貼 0
大人“不愛零食”的真相上熱搜我國零食相關企業已超570萬家

和訊網 2025-07-18 11:32:30
0 跟貼 0
貓的記憶有多久？

大都地理 2025-07-19 02:06:05
0 跟貼 0
男子搞不懂這種商業邏輯，一分錢一個的打火機，賠的連底褲都沒了

美妙一籮筐 2025-07-17 14:23:05
927 跟貼 927
本來以為是個小工程，沒想到是大壩漏水，這玩意得墊資幾億修吧

樹心全觀 2025-07-18 10:04:27
2715 跟貼 2715
上海最貴？一碗面1588元，另收10%服務費，網友直呼：太瘋狂

環球網資訊 2025-07-16 09:10:08
13167 跟貼 13167
特朗普商人邏輯上線：“援烏”變“買賣”！北約買單，美國供貨？

主持人芳姐 2025-07-16 18:36:28
1 跟貼 1
大批北約援助裝甲車抵達烏克蘭一眼望不到頭

老趙觀天下 2025-07-18 18:06:55
9385 跟貼 9385
一場8小時的投票：美國“加密周”暗流涌動！從“看空”到“力挺”，特朗普為何擁抱穩定幣？

每日經濟新聞 2025-07-19 14:09:44
0 跟貼 0
德魯茲之殤：以色列為何一腳踏進敘利亞的泥潭？

Wilsonhe8 2025-07-17 01:15:01
7181 跟貼 7181
河北邯鄲初中數學求值題，構造零零模型來解題！

三樂大掌柜 2025-07-17 07:48:11
5 跟貼 5
殺魚師傅處理一條鯪魚簡直就是視覺盛宴

小好說趣 2025-07-15 23:12:11
0 跟貼 0
網絡上最詭異的五個視頻，黑衣從傳送門出來，是攝像頭故障嗎？

大金子夢想環游世界 2025-07-16 12:36:52
0 跟貼 0
訓練太復雜？對圖片語義、布局要求太高？圖像morphing一步到位

機器之心Pro 2025-07-18 17:53:42
0 跟貼 0
谷歌發布新架構，用一半內存實現推理速度翻倍

DeepTech深科技 2025-07-17 17:49:23
24 跟貼 24
美國對中國滲透已久，那些暗中扶持的“內鬼”正悄悄露頭

小濤叨叨 2025-07-19 05:07:00
0 跟貼 0
妻子剛去外地出差，丈夫就干出這種事，還好妻子裝了攝像頭

夭夭聊生活 2025-07-18 16:10:27
0 跟貼 0
網友花一萬多買的手機，一打開后置攝像頭驚呆了

愛上熱點 2025-07-18 09:37:09
3 跟貼 3
什么樣的人是邏輯天花板？當代福爾摩斯？

磨時藝術 2025-07-18 18:59:37
0 跟貼 0
宋井寬：AI賦能——多模態大模型前沿及在汽車行業應用

新浪財經 2025-07-18 10:20:54
0 跟貼 0
如何通過路面數字標識準確判斷測速監控攝像頭

何轐說 2025-07-15 02:43:04
1 跟貼 1
有創意的小實驗，居然是制作手指模型

木木搞笑配音 2025-07-17 18:27:58
1 跟貼 1

諾獎得主哈佛演講：生命如此短暫，必須對某樣事物傾注深情

諾獎得主哈佛演講：生命如此短暫，必須對某樣事物傾注深情

尚曦讀史

2025-07-17 19:00:03

不到倆月獲利上億！河南小伙靠假煙狂賺，投入200萬不到一周回本

不到倆月獲利上億！河南小伙靠假煙狂賺，投入200萬不到一周回本

明月聊史

2025-07-17 14:31:40

“女吃播三巨頭”現狀：喪失味覺、面相非人非鬼，腦溢血到立遺囑

“女吃播三巨頭”現狀：喪失味覺、面相非人非鬼，腦溢血到立遺囑

娛樂看阿敞

2025-06-21 16:10:59

大連造船廠神秘分段曝光：004型航母的建造信號？

大連造船廠神秘分段曝光：004型航母的建造信號？

楊風

2025-07-19 00:15:26

華野一個奇怪現象：一旦粟裕準備打大仗，參謀長就剛好不在司令部

華野一個奇怪現象：一旦粟裕準備打大仗，參謀長就剛好不在司令部

老謝談史

2025-04-30 10:30:22

曝杜建英并未與原配離婚兩人婚姻持續至今還生了一個兒子已36歲

曝杜建英并未與原配離婚兩人婚姻持續至今還生了一個兒子已36歲

探源歷史

2025-07-18 15:50:14

牛彈琴：全世界看得目瞪口呆

大象新聞

2025-07-18 07:48:38

1951年一名15歲志愿軍手癢癢，朝美軍開了一炮，結果被記了二等功

1951年一名15歲志愿軍手癢癢，朝美軍開了一炮，結果被記了二等功

近史談

2025-07-18 06:16:07

“消失的嘴唇”，年紀一大嘴唇就變薄，顯老沒氣質，男神也變路人

“消失的嘴唇”，年紀一大嘴唇就變薄，顯老沒氣質，男神也變路人

上官晚安

2025-07-16 17:48:03

吃相太難看！陳佩斯砸上億拍電影，結果上映前3天被一腳踹下臺

吃相太難看！陳佩斯砸上億拍電影，結果上映前3天被一腳踹下臺

坊聞本尊

2025-07-18 18:21:08

張靚穎是越來越放的開了，新造型不斷突破，創新能力很強

張靚穎是越來越放的開了，新造型不斷突破，創新能力很強

動物奇奇怪怪

2025-07-17 12:46:51

定居美國10余年，78歲卻回國“撈金”，她憑啥被稱“人民藝術家”

定居美國10余年，78歲卻回國“撈金”，她憑啥被稱“人民藝術家”

夢史

2025-04-01 11:59:20

央媽牛市大放水！7月19日，凌晨的三大重要消息全面來襲

央媽牛市大放水！7月19日，凌晨的三大重要消息全面來襲

風口招財豬

2025-07-19 01:21:00

張鎮麟交易曝光？塵埃落定，傷情意外，誰注意他表態，楊鳴祝福

張鎮麟交易曝光？塵埃落定，傷情意外，誰注意他表態，楊鳴祝福

東球弟

2025-07-19 07:14:14

拔出蘿卜帶出泥，一張執行令讓董卿“晚節不保” 善惡報應都應驗

拔出蘿卜帶出泥，一張執行令讓董卿“晚節不保” 善惡報應都應驗

素衣讀史

2025-07-18 16:16:33

個人夏聯新高，富永啟生全場13中4，出戰19分鐘砍下12分

個人夏聯新高，富永啟生全場13中4，出戰19分鐘砍下12分

懂球帝

2025-07-19 11:42:16

宗慶后被曝有7子，看了宗馥莉為他立的墓碑，才知道她早就布局了

宗慶后被曝有7子，看了宗馥莉為他立的墓碑，才知道她早就布局了

麥大人

2025-07-18 12:05:16

廣東普通高考本科批次正式投檔共投出考生317135人

廣東普通高考本科批次正式投檔共投出考生317135人

南方都市報

2025-07-19 12:35:18

褲子那里鼓鼓的，當代都市麗人都被女裝做局了

褲子那里鼓鼓的，當代都市麗人都被女裝做局了

網易上流

2025-07-10 09:32:02

曝3名高中生失聯重大細節！可怕的并非緬北詐騙犯，10天前有異常

曝3名高中生失聯重大細節！可怕的并非緬北詐騙犯，10天前有異常

涵豆說娛

2025-07-18 11:34:14

暢銷書《復利思維》作者；精神生活與商業探索，關注科技人文、消費電商、品牌營銷、商業認知思維等方面。

477文章數 90關注度

往期回顧全部

科技要聞

工信部等約談17家車企巨頭，競爭劃新紅線

頭條要聞

男子時隔5年再因"重婚"被警方調查自稱沒辦過結婚證

頭條要聞

男子時隔5年再因"重婚"被警方調查自稱沒辦過結婚證

體育要聞

西蒙尼最彪悍的弟子，正成為下個“匪帥”

娛樂要聞

肖戰微博改名爆！保留了三部代表作

財經要聞

娃哈哈爭產大戰：杜建英的進擊

汽車要聞

中汽中心新能源檢驗中心煥新發布"汽車行車控制安全技術驗證VCTA"

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

手機

藝術

親子

公開課

本地新聞

換個城市過夏天 | 誰打翻了濰坊的調色盤？

手機要聞

手機設計同質化！智能機不如功能機，只因用戶需要？

藝術要聞

故宮珍藏的墨跡《十七帖》，比拓本更精良，這才是地道的魏晉寫法

親子要聞

媽媽真實記錄姐妹倆學習半小時，姐姐專注力滿分

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
你到底該和什么樣的人做朋友？
李彥宏：百度離破產30天

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：晴隆县| 汝阳县| 黄龙县| 龙川县| 钟山县| 岳池县| 军事| 集安市| 德化县| 宁波市| 德阳市| 宁夏| 桐城市| 齐齐哈尔市| 开平市| 蒙城县| 张家口市| 龙山县| 色达县| 福鼎市| 会昌县| 斗六市| 博客| 海盐县| 常宁市| 贵溪市| 茌平县| 韶关市| 天津市| 博罗县| 临西县| 郸城县| 将乐县| 洛川县| 丰台区| 应用必备| 龙里县| 胶州市| 鄂托克旗| 壤塘县| 阜新市|