99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

巨頭搶灘、資本沸騰,AI智能體如何跨越「幻覺」陷阱?

0
分享至



作者|路世明

編輯|大 風(fēng)

Manus的出現(xiàn),激起了科技與資本市場的雙重震蕩,一時間AI Agent相關(guān)概念股集體大漲,阿里、谷歌、微軟等科技巨頭密集發(fā)布智能體研發(fā)計劃......

而在這場熱潮的背后,是AI技術(shù)從“被動應(yīng)答”向“主動執(zhí)行”的范式躍遷。

盡管市場的評價褒貶不一,但不能否認(rèn),Manus的突破性在于,它首次驗證了通用型AI Agent在復(fù)雜場景下的商業(yè)化可行性。

傳統(tǒng)的大語言模型雖能生成文本,卻難以閉環(huán)執(zhí)行任務(wù),而Manus通過“規(guī)劃-驗證-執(zhí)行”的架構(gòu),將AI大模型的認(rèn)知能力轉(zhuǎn)化為生產(chǎn)力工具。

根據(jù)麥肯錫等多份權(quán)威報告,在多元化需求驅(qū)動下,AI Agent市場呈爆發(fā)式增長態(tài)勢,2024年全球AI Agent市場規(guī)模約為51億美元,預(yù)計2030年將飆升至471億美元,復(fù)合年增長率高達(dá)44.8%。

然而,這場“智能體浪潮”并非坦途。技術(shù)瓶頸與商業(yè)野心的碰撞,讓AI Agent的競爭既充滿想象力,又暗藏風(fēng)險。

破壁之戰(zhàn)

本質(zhì)上,AI Agent的是具備人類思維范式的數(shù)字勞動力。

如果說聊天機(jī)器人還停留在“對話”階段,那么Agent則已經(jīng)開始“行動”。簡單來說,可以理解為一種更智能、更自主的AI應(yīng)用,它不僅能回答問題,還能執(zhí)行任務(wù)、完成交易。

它們可以被應(yīng)用于各種場景,如客戶服務(wù)、金融分析、軟件開發(fā)等,極大地提高了生產(chǎn)力和效率。

以大語言模型為“大腦”,AI Agent不僅能理解指令表層語義,更能捕捉隱含需求。例如用戶說“找性價比高的酒店”,Manus會結(jié)合季節(jié)、當(dāng)?shù)鼗顒拥壬舷挛耐评沓觥邦A(yù)算敏感型”或“體驗優(yōu)先型”需求。

而可以期待的是,隨著大模型在多模態(tài)能力上的持續(xù)突破,特別是多模態(tài)融合技術(shù)的迭代升級,AI Agent將能夠更精準(zhǔn)地解析并反饋用戶需求,逐步實(shí)現(xiàn)類人類的視聽感知與交互能力。

這將使得AI Agent可以應(yīng)用于更廣泛的領(lǐng)域,如醫(yī)療診斷、自動駕駛、智能安防等。



在單體智能持續(xù)優(yōu)化的同時,還可以想象的是,未來的AI Agent或許也能夠突破單機(jī)運(yùn)作模式,通過協(xié)同機(jī)制重構(gòu)復(fù)雜任務(wù)處理與決策鏈條。

這種多智能體系統(tǒng)(MAS)通過角色定位機(jī)制,能夠使每個智能體如同專業(yè)化分工的人類團(tuán)隊。

舉例來說,在軟件開發(fā)的場景下,每個AI Agent都有自己的特長,有的擅長編程,有的擅長設(shè)計,還有的專門檢查質(zhì)量,只要它們能很好的協(xié)作,就能一起完成一個高質(zhì)量的軟件項目。

此外,MAS系統(tǒng)還能模擬人類的決策過程,就像人遇到問題時會找人商量一樣,多智能體也可以模擬集體決策的行為,這樣就能為用戶提供更好的信息支持,特別是在一些復(fù)雜的情況下。

比如遇到緊急情況,這些AI智能體就能幫用戶模擬所有可能的情形,及時提供有用的信息,讓用戶能更快更好的作出決定。

可以說,這種“類人”的智能范式,正在重構(gòu)生活、工作的成本結(jié)構(gòu)。而從Manus開始,似乎AI Agent已從概念驗證階段,邁入規(guī)模化落地的臨界點(diǎn)。

巨頭競速

AI Agent的熱潮并非偶然,而是技術(shù)演進(jìn)的必然產(chǎn)物。

早在2024年紅杉AI峰會上,吳恩達(dá)教授便預(yù)言“AI Agent是AI發(fā)展的下一個關(guān)鍵階段”。事實(shí)上,2024年期間,便有不少科技巨頭布局AI Agent。

如谷歌在2024年12月發(fā)布了其最新版大模型Gemini2.0系列,并介紹了多個智能體應(yīng)用,如ProjectAstra。微軟也在2024年10月和11月分別發(fā)布了多個面向銷售、運(yùn)營等場景的AI智能體,并推出CopilotStudio平臺支持用戶構(gòu)建自主智能體。

進(jìn)入2025年,Manus的火熱,徹底帶動了市場的情緒。

海外,OpenAI近期公布的商業(yè)化計劃進(jìn)一步印證AI Agent的B端潛力。其“博士水平”Agent針對科研與軟件開發(fā)場景,每月服務(wù)費(fèi)高達(dá)2萬美元,覆蓋從基礎(chǔ)分析到復(fù)雜任務(wù)的全鏈條需求。

國內(nèi)方面,阿里千問QwQ-32B模型中也集成了與智能體Agent相關(guān)的能力,使其能夠在使用工具的同時進(jìn)行批判性思考,并根據(jù)環(huán)境反饋調(diào)整推理過程。

另一方面,開源社區(qū)已出現(xiàn)OpenManus、OWL等新產(chǎn)品,基于Manus進(jìn)行復(fù)刻和創(chuàng)新,有望推動Agent產(chǎn)品百花齊放。

資本市場的狂熱更加印證了這一趨勢。

Manus發(fā)布當(dāng)天,A股超150只AI智能體概念股漲停,立方控股、酷特智能等漲幅超20%。



來源:東方財富

此外,Manus發(fā)布后,券商PPT、分析師路演火速上線,不完全統(tǒng)計顯示,中金、華泰、招商、中泰等數(shù)十家券商研究所進(jìn)行了路演,其中有分析師上線了多場路演,路演內(nèi)容從技術(shù)原理、AI應(yīng)用、受益方向到落地場景、產(chǎn)業(yè)圈推演,內(nèi)容豐富。

當(dāng)然,在熱潮的背后,也有不同的聲音。不少業(yè)內(nèi)人士認(rèn)為,Manus屬于AI Agent初級的應(yīng)用,市場的反應(yīng)過大了。

事實(shí)也的確如此,AI會進(jìn)一步拉平信息差,大量收集信息、整理資料的工作可以交給AI,但真正距離生成投資決策,無疑還有很長的路要走。

其中,最大的挑戰(zhàn)在于:AI幻覺的幽靈始終縈繞不去。

技術(shù)瓶頸

AI Agent的競爭,入口為王。

當(dāng)掌握更多用戶流量的廠商,有望實(shí)現(xiàn)“流量-數(shù)據(jù)-使用體驗”的正向循環(huán),且隨著開源模型能力升級彌補(bǔ)大廠及中小廠技術(shù)代差,AI產(chǎn)品工程化能力,或拉開產(chǎn)品使用體驗差距。

可盡管展現(xiàn)出巨大的潛力,但AI Agent的爆發(fā)仍面臨多重障礙。從商業(yè)模式到技術(shù)瓶頸,從法規(guī)缺失到用戶認(rèn)知,每個環(huán)節(jié)都在考驗著行業(yè)的耐心。

首當(dāng)其沖的原因就在于,現(xiàn)有技術(shù)還無法有效地解決AI幻覺的問題。

以當(dāng)紅的Manus來說,雖然在GAIA基準(zhǔn)測試中取得了優(yōu)異成績,但在實(shí)際應(yīng)用中,仍存在一些不穩(wěn)定的情況。



GAIA基準(zhǔn)測試排名來源:ManusAIX平臺

有實(shí)測用戶反饋,在處理復(fù)雜任務(wù)時,Manus偶爾會出現(xiàn)任務(wù)執(zhí)行失敗或結(jié)果不準(zhǔn)確的問題。在進(jìn)行股票數(shù)據(jù)分析時,Manus可能會因為數(shù)據(jù)接口的臨時故障或數(shù)據(jù)格式的細(xì)微變化,導(dǎo)致分析結(jié)果出現(xiàn)偏差。

再以O(shè)penAI的GPT4.5來說,毫無疑問,這是目前最強(qiáng)的大語言模型。但在SimpleQA基準(zhǔn)測試中,GPT-4.5的準(zhǔn)確率為62.5%,幻覺率為7.1%,盡管這一成績要遠(yuǎn)優(yōu)于GPT-4o、OpenAIo1和o3-mini等模型,但是依然存在著相當(dāng)高的幻覺率。

而這種幻覺,在金融、醫(yī)療等高風(fēng)險領(lǐng)域,任何一點(diǎn)誤差,都可能引發(fā)系統(tǒng)性風(fēng)險。

假設(shè)某醫(yī)療診斷Agent,其誤判罕見病案例的概率為3%,客若應(yīng)用于千萬級用戶群體,那么潛在誤診人數(shù)將高達(dá)30萬。

除了幻覺,緊接著的是數(shù)據(jù)孤島與通用能力的矛盾。

AI Agent的效能高度依賴場景數(shù)據(jù),例如金融風(fēng)控需要實(shí)時交易數(shù)據(jù),而醫(yī)療診斷依賴患者病史庫,數(shù)據(jù)割裂會導(dǎo)致通用型Agent難以跨領(lǐng)域遷移。

最后是倫理與監(jiān)管的滯后性。AI Agent的自主決策涉及隱私泄露、責(zé)任歸屬等倫理問題,比如調(diào)用用戶健康數(shù)據(jù)、自動駕駛事故等等,而全球監(jiān)管框架尚未成熟。

由此可見,AI Agent的破局路徑需從技術(shù)、生態(tài)與監(jiān)管三端協(xié)同推進(jìn)。而未來,誰能率先突破技術(shù)瓶頸并構(gòu)建合規(guī)生態(tài),毫無疑問,誰就將主導(dǎo)這場智能體時代的“諾曼底登陸”。

聲明:個人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
特朗普收到判決,對華關(guān)稅戰(zhàn)被判非法,一切都在中國的預(yù)料之中

特朗普收到判決,對華關(guān)稅戰(zhàn)被判非法,一切都在中國的預(yù)料之中

劉慶彬
2025-05-29 15:01:11
外媒預(yù)測楊瀚森首輪第4順位!超長選秀報告列優(yōu)劣勢 直言籃球天才

外媒預(yù)測楊瀚森首輪第4順位!超長選秀報告列優(yōu)劣勢 直言籃球天才

顏小白的籃球夢
2025-05-29 08:37:54
最后48小時,中方降級參會?美防長確認(rèn)出席,馬克龍也來上臺致辭

最后48小時,中方降級參會?美防長確認(rèn)出席,馬克龍也來上臺致辭

說天說地說實(shí)事
2025-05-28 22:40:20
中山美穗兒子放棄遺產(chǎn)繼承權(quán) 其長年與父親住在法國

中山美穗兒子放棄遺產(chǎn)繼承權(quán) 其長年與父親住在法國

東方不敗然多多
2025-05-29 13:43:55
香港百萬網(wǎng)紅娶日本妻,150萬6次試管均失敗,現(xiàn)又花25萬美金求子

香港百萬網(wǎng)紅娶日本妻,150萬6次試管均失敗,現(xiàn)又花25萬美金求子

七阿姨愛八卦
2025-05-28 20:55:18
亞朵,擠滿了偷偷開房的中年女人

亞朵,擠滿了偷偷開房的中年女人

快刀財經(jīng)
2025-05-20 22:21:25
“空調(diào)霸主”日本,為何90%家庭用掛機(jī),造型還越做越“怪”?

“空調(diào)霸主”日本,為何90%家庭用掛機(jī),造型還越做越“怪”?

裝修秀
2025-05-28 11:45:03
天呢!網(wǎng)傳最大的鐵飯碗要破裂,直接影響200萬人生計…

天呢!網(wǎng)傳最大的鐵飯碗要破裂,直接影響200萬人生計…

慧翔百科
2025-05-21 14:02:24
蘋果iOS18.5更新反饋:這才是該有的優(yōu)化,建議都升級

蘋果iOS18.5更新反饋:這才是該有的優(yōu)化,建議都升級

庫克啥都聊
2025-05-29 15:24:27
罷免吳思瑤案功虧一簣,凸顯國民黨無能

罷免吳思瑤案功虧一簣,凸顯國民黨無能

特特農(nóng)村生活
2025-05-29 14:02:19
以前總理批以政府犯下戰(zhàn)爭罪,坦言無法繼續(xù)為這場戰(zhàn)爭開脫

以前總理批以政府犯下戰(zhàn)爭罪,坦言無法繼續(xù)為這場戰(zhàn)爭開脫

大象新聞
2025-05-29 15:30:53
51歲陳德容大方談離婚!結(jié)束8年婚姻談愛情沒意思,浪費(fèi)時間心累

51歲陳德容大方談離婚!結(jié)束8年婚姻談愛情沒意思,浪費(fèi)時間心累

檸檬有娛樂
2025-05-29 10:27:58
突然發(fā)現(xiàn)自家車位變窄25厘米,鄰居:之前線畫的不對,我重新畫了

突然發(fā)現(xiàn)自家車位變窄25厘米,鄰居:之前線畫的不對,我重新畫了

江蘇維哲律師事務(wù)所
2025-05-26 10:59:49
蘇群曝楊瀚森內(nèi)幕!試訓(xùn)球隊達(dá)11支,三支極其喜歡,選秀行情不錯

蘇群曝楊瀚森內(nèi)幕!試訓(xùn)球隊達(dá)11支,三支極其喜歡,選秀行情不錯

籃球資訊達(dá)人
2025-05-28 18:47:23
劉德華12歲女兒近照曝光,花5億撫養(yǎng)大的女兒,沒想到長成了這樣

劉德華12歲女兒近照曝光,花5億撫養(yǎng)大的女兒,沒想到長成了這樣

貴圈小王爺
2025-05-08 17:56:42
恭喜!個人所得稅再添一項扣除:每年可多抵扣12000元!

恭喜!個人所得稅再添一項扣除:每年可多抵扣12000元!

稅海拾真
2025-05-29 10:28:14
中國被巴鐵背刺?巴基斯坦將1.8萬億銅金礦,全交給加拿大開發(fā)!

中國被巴鐵背刺?巴基斯坦將1.8萬億銅金礦,全交給加拿大開發(fā)!

說說史事
2025-05-28 16:10:34
深夜,75歲獨(dú)居老人在家摔倒,他躺在地上,摸到的只有冰冷的手機(jī)

深夜,75歲獨(dú)居老人在家摔倒,他躺在地上,摸到的只有冰冷的手機(jī)

澤澤先生
2025-05-29 11:23:28
“皮卡丘”“王子殿下”“耐克”等名字被點(diǎn)名批評,日本出臺新規(guī)禁止名字“發(fā)音古怪”!

“皮卡丘”“王子殿下”“耐克”等名字被點(diǎn)名批評,日本出臺新規(guī)禁止名字“發(fā)音古怪”!

極目新聞
2025-05-29 15:04:05
斷了,全斷了,打工人到底能捅多大的簍子?

斷了,全斷了,打工人到底能捅多大的簍子?

中國先進(jìn)制造技術(shù)論壇
2025-05-28 17:38:04
2025-05-29 16:08:49
鋅財經(jīng)
鋅財經(jīng)
新商業(yè)的記錄者新經(jīng)濟(jì)的推動者
5859文章數(shù) 43298關(guān)注度
往期回顧 全部

科技要聞

英偉達(dá)財報炸裂 黃仁勛卻嘆退出中國太可惜

頭條要聞

揚(yáng)州一棟清代合院618元起拍:系個人所有 有文物屬性

頭條要聞

揚(yáng)州一棟清代合院618元起拍:系個人所有 有文物屬性

體育要聞

東決G4的哈利交出了一場無瑕疵的比賽

娛樂要聞

那些被癌癥帶走的絕代佳人

財經(jīng)要聞

美聯(lián)邦法院阻止特朗普4月2日關(guān)稅政策生效

汽車要聞

搭載Thor芯片 領(lǐng)克900城市NOA挑戰(zhàn)重慶

態(tài)度原創(chuàng)

游戲
時尚
親子
本地
健康

埃洛伊CV對AI配音感到擔(dān)憂:年輕人的機(jī)會將越來越少

牛仔“藍(lán)”很忙,忙著占領(lǐng)你的眼妝

親子要聞

艾媒咨詢 | 2025年中國月子中心消費(fèi)者行為調(diào)查數(shù)據(jù)

本地新聞

云游中國 |來仰天湖大草原,一起策馬奔騰

唇皰疹和口腔潰瘍是"同伙"嗎?

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 三原县| 古蔺县| 石门县| 平阳县| 临颍县| 阿勒泰市| 荥经县| 阜宁县| 夏邑县| 新建县| 同德县| 井冈山市| 清镇市| 措勤县| 榆中县| 寻甸| 庆安县| 鱼台县| 城口县| 错那县| 噶尔县| 双桥区| 磐安县| 泰兴市| 余姚市| 泾源县| 墨竹工卡县| 华容县| 龙南县| 罗平县| 沐川县| 黄冈市| 武陟县| 翁牛特旗| 正镶白旗| 双鸭山市| 赫章县| 微山县| 德令哈市| 湖北省| 五台县|