過去的互聯(lián)網(wǎng)時(shí)代,如果說是一個(gè)主動(dòng)尋找信息的時(shí)代,那么未來極有可能會(huì)是一個(gè)AI替你思考執(zhí)行的時(shí)代,搜索是在海量信息中自己尋找答案,而思考則是直接給你答案。
今年上海車展,兩組數(shù)字最搶眼,193和500,前面是發(fā)布會(huì)的數(shù)量,后面是自媒體人們失去的車馬費(fèi)。
很多人類在面對(duì)AI時(shí),保有的最后自信是,AI不能像人類一樣去探索世界,它沒有眼睛、耳朵、鼻子、舌頭和身體,所以AI只能在信息存量的時(shí)間里處理信息,增量信息還是要靠人類。
但是,今天的AI公司們很顯然不滿足于這樣的限制,他們?cè)谠噲D讓AI通過手機(jī)擁有眼睛和耳朵,比如這屆上海車展,大量的參會(huì)展商和媒體以及尤其海外的,大量開始借助AI逛展,他們用夸克的AI相機(jī)掃描所有新的車型以及展館資料,快速掌握需要信息。
該說不說,在全世界的車展都式微的時(shí)候,中國(guó)屬于少數(shù)還在逆勢(shì)增長(zhǎng)的市場(chǎng),上海車展193場(chǎng)發(fā)布會(huì),如果你是一個(gè)帶著學(xué)習(xí)心態(tài)來參會(huì)的國(guó)外參展商和媒體,你需要提前做多少功課,才能完成學(xué)習(xí)和信息采集的工作?
現(xiàn)在職場(chǎng)很流行一句話:你再不努力,就要被AI干掉了。
在現(xiàn)場(chǎng),一位來自德國(guó)的車企員工告訴我,用夸克,他逛展的時(shí)間提高了一倍以上,他的主要任務(wù),就是把此次車展所有的車型做一下統(tǒng)計(jì),但是根據(jù)場(chǎng)館人流進(jìn)行一下熱度分析,另外就是需要收集各家車企的營(yíng)銷材料和分析營(yíng)銷策略。
事實(shí)上,在今天的大公司,無論是互聯(lián)網(wǎng)大廠,還是新能源車企,員工使用AI工具協(xié)同自己工作,已經(jīng)是家常便飯,這就像當(dāng)年office進(jìn)入辦公室一樣,只要你最終交付的東西足夠滿足使用,并沒有人關(guān)心你的過程如何實(shí)現(xiàn),當(dāng)然,去AI味兒,是一個(gè)很重要的工作。
事實(shí)上,早在十多年前,谷歌就推出了基于搜索的智能鏡頭,手機(jī)拍照后,然后搜索告訴你,這是哪里,可以干什么,但是如今的AI時(shí)代,搜索已經(jīng)不是目的,能看懂圖,能基于圖片思考,才是最核心的目的。
以車展為例,你來到一個(gè)站臺(tái)前,想要了解一款車,你只需要鏡頭對(duì)準(zhǔn)它,然后拍照,你就可以了解到所有的相關(guān)信息,但是重要的是,你可以繼續(xù)提問,讓夸克告訴你,這款車的競(jìng)品是哪些,如何預(yù)判這款車的未來市場(chǎng)潛力,以及上市之前的口碑情況,連續(xù)對(duì)話思考能力,讓你收集信息的過程便捷很多。
另外,現(xiàn)場(chǎng)很多資料,用夸克的AI相機(jī)可以快速掃描成PDF,以及實(shí)現(xiàn)跨語(yǔ)種翻譯,甚至可以讓10張圖形成推理,在其他場(chǎng)景,還可以幫你看體檢報(bào)告、修圖、做導(dǎo)游等等。
我跟很多大廠員工聊過一個(gè)話題,你們對(duì)未來AI的期待是什么,純文字的推理AI能不能滿足使用,最終的答案很有意思,技術(shù)性碼農(nóng)會(huì)跟你扯一堆技術(shù)問題,然后跟你強(qiáng)調(diào)實(shí)現(xiàn)很多功能的困難,但是普通人就很簡(jiǎn)單了,他們希望擁有一個(gè)可以萬能的接收器,可以接收各種資料,音頻、視頻、文字、圖片、程序包、各種格式的文件,然后下達(dá)指令,完成任務(wù)。
毫無疑問,多模態(tài)大模型,一定才是未來AI助手的方向。
比如說,你現(xiàn)在用kimi、deepseek這種推理模型,文字處理能力可能非常強(qiáng),但是如果你需要它幫你修一張圖,整理一個(gè)錄音,生成一個(gè)視頻,這個(gè)時(shí)候,他們就解決不了。
多模態(tài)中,視覺一定是最重要的一環(huán),因?yàn)锳I有了眼睛,才可以幫助用戶更好的了解周邊環(huán)境,更加精準(zhǔn)的知道用戶后續(xù)自然語(yǔ)言的需求,比如你在車展,想知道整個(gè)展會(huì)的布局,然后自己所處的位置,以及怎么去下一個(gè)展館,如果沒有夸克AI相機(jī)來輔助你,你就很難實(shí)現(xiàn),上一個(gè)在地圖中實(shí)現(xiàn)了這個(gè)功能的是谷歌地圖。
最后有一個(gè)邏輯是需要我們注意的,上一個(gè)時(shí)代,攝像頭是服務(wù)于搜索,這個(gè)時(shí)代,攝像頭是服務(wù)于思考。
搜索和思考的差異在哪里?這是需要我們看明白的核心。
除了上述所說的連續(xù)對(duì)話能力,然后就是圖片分析、二次創(chuàng)意、動(dòng)態(tài)引導(dǎo),真正實(shí)現(xiàn)所見即所思,像人類一樣使用雙眼。
現(xiàn)在夸克很大一部分用戶是學(xué)生和老師,這一點(diǎn)我在去年就發(fā)現(xiàn)了,大學(xué)生用夸克幫忙解題,只需要手機(jī)對(duì)著題目,然后就給你解題思路,還能給你講題目,老師可以用夸克掃描試卷,幫你批改試卷,這都是基于圖片理解分析基礎(chǔ)之上實(shí)現(xiàn)的。
我們所處的廣告?zhèn)髅叫袠I(yè),平時(shí)大量遇到內(nèi)容創(chuàng)意的問題,必須一張圖需要一個(gè)文案,你可以讓夸克幫你寫,然后再修改,如果涉及到版權(quán)問題,還可以讓夸克幫你二創(chuàng)一下,比如生成一個(gè)卡通風(fēng)格的,或者修改掉一些圖片元素。
動(dòng)態(tài)引導(dǎo),其實(shí)在未來的使用場(chǎng)景會(huì)非常豐富,我直接認(rèn)為,這個(gè)功能會(huì)讓這個(gè)世界從此不再有陌生的城市,你去往哪里,只需要用攝像頭看一下周邊,然后你需要什么,就可以一一給你羅列出來,今天的地圖、點(diǎn)評(píng)、社交等等功能會(huì)被打通。
過去的互聯(lián)網(wǎng)時(shí)代,如果說是一個(gè)主動(dòng)尋找信息的時(shí)代,那么未來極有可能會(huì)是一個(gè)AI替你思考執(zhí)行的時(shí)代,搜索是在海量信息中自己尋找答案,而思考則是直接給你答案。
一個(gè)框,可以有眼睛、耳朵和嘴巴,人類未來的AI助手時(shí)代正在一步步走向我們,巨頭們正在這個(gè)賽道里你爭(zhēng)我搶,很顯然夸克、豆包、元寶已經(jīng)組成了多模態(tài)在應(yīng)用層面的第一梯隊(duì)。
這里面,最讓人意外的其實(shí)就是夸克,猶如一匹黑馬,從最開始定位AI搜索,到圍繞這一核心功能衍生出的網(wǎng)盤、掃描等等更加多元垂類應(yīng)用,再到入主大模型之后,通過AI對(duì)問答、圖文識(shí)別、推理、甚至是基于當(dāng)前交互語(yǔ)境的二創(chuàng)的改造,眾多場(chǎng)景中,這種反饋已經(jīng)可以被視為人類的腦子代理。
今天的夸克,以及其所強(qiáng)調(diào)的“超級(jí)框”“超級(jí)Agent”等產(chǎn)品認(rèn)知,于內(nèi),其實(shí)也應(yīng)了事業(yè)群總裁吳嘉的那句“人用AI,AI用工具”;而于外,一句“大模型心高氣傲,沒有AI Agents生死難料”,足以證明業(yè)務(wù)背后對(duì)于趨勢(shì)的押中。
有著較多的用戶基礎(chǔ),讓夸克能掌握最逼真的用戶需求,多年的產(chǎn)品市場(chǎng)驗(yàn)證,確保了每一個(gè)功能的調(diào)用量足夠大,甚至付費(fèi)意愿比較強(qiáng),Qwen的模型能力,確保了夸克在業(yè)內(nèi)一直可以維持一流的產(chǎn)品與技術(shù)能力。
需求和能力的相互加持,實(shí)現(xiàn)產(chǎn)品的最終交付,這是目前市面上,時(shí)間、需求、技術(shù)三要素配合的最好的一款產(chǎn)品,而且在阿里內(nèi)部屬于最年輕的項(xiàng)目,沒有歷史負(fù)擔(dān),身輕如燕,未來可期。
學(xué)生、打工人,這才是AI調(diào)用量最大的人,他們才是剛需,其實(shí)想知道,未來在應(yīng)用層面誰(shuí)會(huì)贏,問問用戶,答案自然明了。
歡迎加入長(zhǎng)三角momo粉絲群,和我們一起分享你的職場(chǎng)經(jīng)歷和八卦吧!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.