【城主說(shuō)】即日起,天空之城和大家日常分享最新AI科技長(zhǎng)訪的內(nèi)容精讀合集。
感謝科技的進(jìn)步,每一個(gè)長(zhǎng)訪都可以有萬(wàn)字全文,但或許更稀缺的是時(shí)間。希望本城日常精讀可以幫助大家在最有限時(shí)間里掌握最新的科技商業(yè)認(rèn)知。同時(shí)附上完整視頻和全文的鏈接,感興趣的同學(xué)可以繼續(xù)針對(duì)特定內(nèi)容深入了解。
天空科技商業(yè)精讀04.28| 內(nèi)容目錄
? AI教父辛頓:世界還沒(méi)有為即將到來(lái)的一切做好準(zhǔn)備 20250426
? Yann LeCun教授講座 @新加坡國(guó)立大學(xué)NUS120周年20250427
? Perplexity CEO:從學(xué)者到90億美元AI先驅(qū) |哈佛商學(xué)院創(chuàng)業(yè)峰會(huì) 20250425
? YC總裁:AI智能體的下一個(gè)突破就在這里(Manus) 20250408
AI教父辛頓:世界還沒(méi)有為即將到來(lái)的一切做好準(zhǔn)備 20250426
視頻和全文鏈接:
https://www.bilibili.com/video/BV1irLCzME2L/
內(nèi)容精讀:
杰弗里·辛頓因其在機(jī)器學(xué)習(xí)領(lǐng)域的開(kāi)創(chuàng)性工作獲得認(rèn)可,他在1986年提出的使用神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)序列中下一個(gè)詞的概念,奠定了當(dāng)今大型語(yǔ)言模型的基礎(chǔ)。盡管他預(yù)見(jiàn)到人工智能可能在教育、醫(yī)學(xué)和氣候變化等領(lǐng)域帶來(lái)變革,但他對(duì)人工智能進(jìn)展的速度深感擔(dān)憂,將其比作飼養(yǎng)一只幼虎,無(wú)法確定其長(zhǎng)大后是否會(huì)構(gòu)成威脅。辛頓預(yù)測(cè)人工智能可能加劇獨(dú)裁統(tǒng)治,增強(qiáng)黑客能力,并大膽猜測(cè)人工智能有10%到20%的風(fēng)險(xiǎn)會(huì)取代人類,他甚至為此將存款分散到三家銀行。核心問(wèn)題在于,我們能否設(shè)計(jì)出永遠(yuǎn)保持仁慈、不想掌控一切的人工智能。
辛頓擔(dān)憂,科技公司間的激烈競(jìng)爭(zhēng),正驅(qū)使它們?yōu)榱硕唐诶麧?rùn)而愚蠢自私地將全人類置于危險(xiǎn)之中,它們甚至游說(shuō)反對(duì)加強(qiáng)本就薄弱的人工智能監(jiān)管。這種對(duì)當(dāng)權(quán)派的反抗精神貫穿辛頓的人生:他曾因美國(guó)人工智能資助與國(guó)防部掛鉤而移居加拿大,并在神經(jīng)網(wǎng)絡(luò)被視為不可行時(shí)堅(jiān)持研究數(shù)十年。他將這種逆向思維和堅(jiān)持歸因于家庭影響,包括他的昆蟲(chóng)學(xué)家父親,以及更早的先輩如喬治·布爾和喬治·埃佛勒斯,并認(rèn)為自己繼承了對(duì)機(jī)械事物運(yùn)作原理的好奇心。
辛頓坦言,他喜歡“修補(bǔ)”事物,無(wú)論是修理?yè)p壞的相機(jī)濾鏡,還是花費(fèi)大量時(shí)間調(diào)整神經(jīng)網(wǎng)絡(luò)模型以理解其行為,這種動(dòng)手探索是他研究方法的一部分。他回憶起與他最著名的門(mén)生、后來(lái)成為OpenAI首席科學(xué)家的伊利亞·蘇茨克維爾一起觀察模型學(xué)習(xí)并預(yù)測(cè)結(jié)果的時(shí)光。辛頓對(duì)蘇茨克維爾參與罷免OpenAI首席執(zhí)行官薩姆·奧特曼(據(jù)報(bào)道是出于安全擔(dān)憂)表示贊賞,但也認(rèn)為蘇茨克維爾此舉很“天真”,因?yàn)榇伺e危及了員工即將獲得的巨額財(cái)富,最終奧特曼回歸,蘇茨克維爾離職。
辛頓同樣對(duì)谷歌等前雇主及其他前沿人工智能公司(包括Meta)表示失望,批評(píng)它們違背了不將人工智能用于軍事目的的承諾,并認(rèn)為它們?cè)诎踩度肷蠂?yán)重不足,例如用于安全研究的計(jì)算資源比例遠(yuǎn)低于應(yīng)有的水平(如三分之一)。他認(rèn)為需要政府監(jiān)管,但對(duì)此并不樂(lè)觀。盡管擔(dān)憂未來(lái),辛頓表示自己并未感到絕望,主要是因?yàn)樗推渌艘粯樱谇楦猩想y以真正接受這個(gè)歷史性的特殊時(shí)刻——一個(gè)一切可能在短時(shí)間內(nèi)發(fā)生前所未有規(guī)模劇變的時(shí)刻。各大人工智能實(shí)驗(yàn)室在被問(wèn)及安全研究投入時(shí),雖聲稱重視安全并原則上支持監(jiān)管,但大多回避具體數(shù)字,并反對(duì)現(xiàn)有的監(jiān)管提案。
? ? ?
Yann LeCun教授講座 @新加坡國(guó)立大學(xué)NUS120周年系列 20250427
視頻和全文鏈接:
https://www.bilibili.com/video/BV1EALmzDEFV/
內(nèi)容精讀:
在新加坡國(guó)立大學(xué)120周年杰出講座系列中,Meta副總裁兼首席人工智能科學(xué)家、紐約大學(xué)教授楊立昆(Yann LeCun)分享了他對(duì)人工智能創(chuàng)新未來(lái)的見(jiàn)解。他強(qiáng)調(diào),盡管當(dāng)前人工智能特別是大型語(yǔ)言模型(LLM)取得了顯著進(jìn)展,但它們距離實(shí)現(xiàn)真正類似人類的智能還有很長(zhǎng)的路要走。構(gòu)建類人智能系統(tǒng)的目標(biāo)并非取代人類,而是增強(qiáng)人類智能,這需要機(jī)器能夠理解物理世界、具備常識(shí)、推理、規(guī)劃能力和持久記憶。
楊立昆指出,當(dāng)前主流的LLM本質(zhì)上是基于自回歸預(yù)測(cè)進(jìn)行訓(xùn)練的,即根據(jù)之前的詞元預(yù)測(cè)下一個(gè)詞元。雖然擴(kuò)大模型規(guī)模和數(shù)據(jù)量能提升其能力,但這存在根本性局限,無(wú)法帶來(lái)真正的理解、規(guī)劃和推理能力,更無(wú)法解決從未見(jiàn)過(guò)的新問(wèn)題。他認(rèn)為,僅僅依賴文本數(shù)據(jù)進(jìn)行訓(xùn)練是遠(yuǎn)遠(yuǎn)不夠的,人類嬰兒通過(guò)感官(尤其是視覺(jué))在短短幾年內(nèi)接收的信息量遠(yuǎn)超當(dāng)前LLM的訓(xùn)練數(shù)據(jù)量,這說(shuō)明了理解物理世界對(duì)于智能的重要性。
他批判了當(dāng)前AI領(lǐng)域,特別是LLM存在的局限,例如缺乏對(duì)物理世界的深刻理解(莫拉維克悖論),無(wú)法進(jìn)行有效的規(guī)劃和推理,以及學(xué)習(xí)效率遠(yuǎn)低于人類和動(dòng)物。他認(rèn)為,過(guò)度迷信LLM的擴(kuò)展能力是錯(cuò)誤的,這是AI發(fā)展史上反復(fù)出現(xiàn)的錯(cuò)誤認(rèn)知。
為了克服這些局限,楊立昆提出需要新的架構(gòu)和學(xué)習(xí)范式。他倡導(dǎo)構(gòu)建能夠通過(guò)觀察和互動(dòng)學(xué)習(xí)世界模型的AI系統(tǒng)。這種世界模型能夠預(yù)測(cè)行動(dòng)的后果,是實(shí)現(xiàn)規(guī)劃和推理能力的基礎(chǔ)。他強(qiáng)調(diào)了通過(guò)優(yōu)化進(jìn)行推理(類似人類的系統(tǒng)二思維)的重要性,這比LLM的固定計(jì)算量前饋推理更為強(qiáng)大。
他重點(diǎn)介紹了自監(jiān)督學(xué)習(xí)(SSL),特別是“聯(lián)合嵌入預(yù)測(cè)架構(gòu)”(JEPA),作為學(xué)習(xí)世界模型的關(guān)鍵方法。與試圖預(yù)測(cè)輸入(如視頻像素)細(xì)節(jié)的生成式方法(如GAN、擴(kuò)散模型)不同,JEPA旨在學(xué)習(xí)輸入的抽象表示,并在這些表示空間中進(jìn)行預(yù)測(cè)。他認(rèn)為,預(yù)測(cè)高維輸入的每一個(gè)細(xì)節(jié)極其困難且低效,而學(xué)習(xí)合適的抽象表示進(jìn)行預(yù)測(cè)才是更有效的路徑,這類似于科學(xué)研究中尋找關(guān)鍵變量進(jìn)行預(yù)測(cè)的過(guò)程。他展示了iJEPA、vJEPA等方法在圖像和視頻理解上取得的優(yōu)于生成式方法的初步成果,并認(rèn)為這類方法有望讓機(jī)器像嬰兒一樣學(xué)習(xí)世界的運(yùn)作規(guī)律,包括直覺(jué)物理學(xué)等常識(shí)。
楊立昆還指出了分層規(guī)劃是實(shí)現(xiàn)高級(jí)智能的另一個(gè)重大挑戰(zhàn),即系統(tǒng)需要能像人一樣將復(fù)雜目標(biāo)分解為子目標(biāo),并在不同抽象層次上進(jìn)行規(guī)劃。當(dāng)前AI系統(tǒng)在這方面能力欠缺,這是一個(gè)亟待解決的核心問(wèn)題。
最后,他提出了一些頗具爭(zhēng)議的建議:研究重心應(yīng)從生成模型轉(zhuǎn)向JEPA等非生成式表示學(xué)習(xí)方法;放棄概率模型而采用基于能量的模型;摒棄對(duì)比學(xué)習(xí),傾向于正則化或蒸餾方法;并盡量減少對(duì)效率低下的強(qiáng)化學(xué)習(xí)的依賴。他總結(jié)道,LLM雖然有用,但對(duì)于追求真正的人工智能(他稱之為AMI,高級(jí)機(jī)器智能,而非AGI)而言可能是一個(gè)“彎路”。未來(lái)的突破在于開(kāi)發(fā)具備世界模型、推理、規(guī)劃能力,并能理解物理世界的AI系統(tǒng),這有望在未來(lái)3到10年內(nèi)實(shí)現(xiàn),并最終帶來(lái)真正有用的智能機(jī)器人。
當(dāng)前,人形機(jī)器人制造的熱潮席卷業(yè)界,眾多公司投身其中。然而,一個(gè)公開(kāi)的秘密是,我們尚未掌握賦予這些機(jī)器人足夠智能以實(shí)現(xiàn)廣泛應(yīng)用的技術(shù),現(xiàn)有能力僅限于狹窄任務(wù)。這些公司寄望于未來(lái)三到五年內(nèi)人工智能取得突破性進(jìn)展,以匹配其硬件的商業(yè)化進(jìn)程,但認(rèn)為當(dāng)前技術(shù)足以支撐通用人形機(jī)器人的想法是錯(cuò)誤的。
開(kāi)源平臺(tái)的必要性日益凸顯,它不僅能讓資源有限的學(xué)術(shù)界參與到昂貴的基礎(chǔ)模型訓(xùn)練中,貢獻(xiàn)智慧,也關(guān)乎維護(hù)國(guó)家主權(quán)以及文化和語(yǔ)言的多樣性。
大型語(yǔ)言模型(LLM)無(wú)疑極具價(jià)值,特別是在提升編碼效率、輔助理解復(fù)雜文檔等方面,它們是實(shí)用的生產(chǎn)力工具,并將持續(xù)改進(jìn)可靠性與多語(yǔ)言能力。但不應(yīng)將其視為通往人類水平人工智能(AGI)的路徑。它們很可能成為未來(lái)更復(fù)雜AI系統(tǒng)的組成部分,例如負(fù)責(zé)將系統(tǒng)的抽象思想轉(zhuǎn)化為連貫的文本,但它們本身并非實(shí)現(xiàn)AGI的關(guān)鍵。
面對(duì)人工智能引發(fā)的就業(yè)焦慮,未來(lái)并非黯淡無(wú)光。盡管各行各業(yè)包括教職都將受到影響,但經(jīng)濟(jì)學(xué)家的分析指出,技術(shù)革命雖會(huì)改變工作性質(zhì),卻不會(huì)導(dǎo)致工作崗位的枯竭,因?yàn)榇鉀Q的問(wèn)題層出不窮。技術(shù)的經(jīng)濟(jì)滲透需要時(shí)間,對(duì)生產(chǎn)率的顯著影響往往需要十多年才會(huì)顯現(xiàn)。AI帶來(lái)的GDP增長(zhǎng)增量預(yù)計(jì)雖可觀(年均約0.7%的額外增長(zhǎng)),但這并非意味著短期內(nèi)會(huì)出現(xiàn)大規(guī)模失業(yè)。
因此,對(duì)于年輕人而言,學(xué)習(xí)具有長(zhǎng)久生命力的基礎(chǔ)知識(shí)和方法論至關(guān)重要,例如選擇基礎(chǔ)科學(xué)(如量子力學(xué))而非短期應(yīng)用技能(如特定移動(dòng)應(yīng)用編程)。培養(yǎng)快速學(xué)習(xí)新事物的能力和深度思考能力,才能在技術(shù)飛速迭代的時(shí)代立于不敗之地,甚至成為管理AI系統(tǒng)的專家,擁有深厚的技術(shù)理解將是巨大優(yōu)勢(shì)。
在金融等特定領(lǐng)域,AI的預(yù)測(cè)能力需克服市場(chǎng)的高度隨機(jī)性。JEPA這類旨在消除噪聲、在抽象層面進(jìn)行預(yù)測(cè)的系統(tǒng)或許能提供新思路,但尚無(wú)定論。機(jī)器人領(lǐng)域同樣需要突破,僅靠視覺(jué)遠(yuǎn)不足夠,觸覺(jué)等多模態(tài)感知對(duì)于與物理世界交互至關(guān)重要,目前這一領(lǐng)域開(kāi)發(fā)尚不充分,但JEPA等方法有望整合不同模態(tài)信息。Meta等公司已將具身人工智能和機(jī)器人技術(shù)視為重要的拓展方向。
值得注意的是,許多科學(xué)領(lǐng)域的AI突破(如AlphaFold)并非依賴LLM,而是采用專門(mén)設(shè)計(jì)的模型和自監(jiān)督學(xué)習(xí)等技術(shù)。實(shí)現(xiàn)完全自主的AI科學(xué)家仍是遙遠(yuǎn)的目標(biāo),且其核心可能并非LLM,而是更接近于能構(gòu)建世界模型、進(jìn)行分層表征和規(guī)劃的架構(gòu)。強(qiáng)化學(xué)習(xí)(RL)在智能體系中的作用更像是“錦上添花”,而非核心驅(qū)動(dòng)力,其樣本效率問(wèn)題限制了在現(xiàn)實(shí)世界(非游戲)的應(yīng)用。
像Llama這樣的開(kāi)源基礎(chǔ)模型,如同操作系統(tǒng)Linux,提供了強(qiáng)大的基礎(chǔ)設(shè)施,而非即用型產(chǎn)品。其真正價(jià)值在于允許開(kāi)發(fā)者根據(jù)特定需求進(jìn)行微調(diào)、定制和本地化部署,降低成本并促進(jìn)創(chuàng)新,從而減少幻覺(jué)等問(wèn)題。訓(xùn)練這些模型需要極其多樣化的數(shù)據(jù),不僅包括自然場(chǎng)景,還需包含物體交互、不同環(huán)境、甚至簡(jiǎn)化圖解化的內(nèi)容(如動(dòng)畫(huà)片),以幫助系統(tǒng)學(xué)習(xí)世界的基本運(yùn)行規(guī)律。
展望未來(lái),我們與數(shù)字世界的互動(dòng)將深度依賴AI助手。為了避免信息流被少數(shù)科技巨頭壟斷,維護(hù)全球文化和語(yǔ)言的多樣性(全球約6000種語(yǔ)言及大量非數(shù)字化文化信息),開(kāi)源是必然趨勢(shì)。需要構(gòu)建能理解全球語(yǔ)言、文化、價(jià)值體系的基礎(chǔ)模型,這無(wú)法由單一實(shí)體完成,而應(yīng)由全球多方協(xié)作。基礎(chǔ)模型將成為公共基礎(chǔ)設(shè)施,通過(guò)全球性的合作伙伴關(guān)系共同訓(xùn)練,正如互聯(lián)網(wǎng)最終由開(kāi)源軟件棧支撐一樣。這為新加坡等地提供了契機(jī),可憑借算力、人才和區(qū)域數(shù)據(jù)優(yōu)勢(shì),成為共建全球共享AI基礎(chǔ)的樞紐,確保AI服務(wù)于全人類的多元需求。開(kāi)源最終將在人工智能領(lǐng)域勝出,只是時(shí)間問(wèn)題。
? ? ? ? ?
Perplexity CEO:從學(xué)者到90億美元AI先驅(qū) |哈佛商學(xué)院創(chuàng)業(yè)峰會(huì) 20250425
視頻和全文鏈接:
https://www.bilibili.com/video/BV154LyzqEA7/
內(nèi)容精讀:
2025年哈佛商學(xué)院創(chuàng)業(yè)峰會(huì)迎來(lái)了重啟,匯聚了學(xué)生、校友及社區(qū)領(lǐng)袖,展現(xiàn)了學(xué)院濃厚的創(chuàng)業(yè)精神。此次峰會(huì)的核心環(huán)節(jié)之一是X Fund管理普通合伙人Patrick Chung對(duì)Perplexity首席執(zhí)行官Arvind Srinivas的訪談。Arvind擁有印度理工學(xué)院馬德拉斯分校的工程學(xué)位和加州大學(xué)伯克利分校的計(jì)算機(jī)科學(xué)博士學(xué)位,他于2022年聯(lián)合創(chuàng)立了人工智能驅(qū)動(dòng)的對(duì)話式搜索引擎Perplexity。該公司在短時(shí)間內(nèi)實(shí)現(xiàn)了顯著增長(zhǎng),月查詢量超6億次,估值達(dá)90億美元,并獲得了杰夫·貝索斯和英偉達(dá)等知名投資者的支持。
訪談中,Arvind分享了他從學(xué)術(shù)界走向創(chuàng)業(yè)的歷程。他出身于重視知識(shí)而非財(cái)富的印度家庭,父母甚至更為他的博士學(xué)位感到驕傲。盡管本科學(xué)習(xí)電氣工程,但他通過(guò)參加機(jī)器學(xué)習(xí)競(jìng)賽(并意外獲勝)以及后續(xù)實(shí)習(xí),接觸并深入學(xué)習(xí)了機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò),包括在線學(xué)習(xí)吳恩達(dá)、杰弗里·辛頓的課程,并在圖靈獎(jiǎng)得主Yoshua Bengio處實(shí)習(xí),最終進(jìn)入伯克利深造。在OpenAI和DeepMind的實(shí)習(xí)經(jīng)歷讓他認(rèn)識(shí)到,將想法付諸實(shí)踐、處理實(shí)際數(shù)據(jù)并完成端到端工作的能力至關(guān)重要,這推動(dòng)了他走向創(chuàng)業(yè)。OpenAI前首席科學(xué)家Ilya Sutskever的直接反饋,特別是強(qiáng)調(diào)生成式無(wú)監(jiān)督學(xué)習(xí)結(jié)合大規(guī)模算力和數(shù)據(jù)是通往通用人工智能(AGI)的關(guān)鍵,深刻影響了他的研究方向。
Arvind認(rèn)為,《硅谷》這部劇雖幽默卻真實(shí)反映了創(chuàng)業(yè)生態(tài),從零創(chuàng)造并交付產(chǎn)品的想法極具吸引力。當(dāng)GitHub Copilot等產(chǎn)品讓他“感受到AI”的實(shí)際應(yīng)用時(shí),他意識(shí)到創(chuàng)辦AI公司的時(shí)機(jī)已到——AI開(kāi)始顯現(xiàn)威力,但尚未完全成熟。Perplexity于2022年8月應(yīng)運(yùn)而生。尋找聯(lián)合創(chuàng)始人時(shí),他先與學(xué)術(shù)上相識(shí)的Dennis Yarats合作,隨后說(shuō)服了Dennis在Quora認(rèn)識(shí)的、當(dāng)時(shí)正考慮職業(yè)變動(dòng)的優(yōu)秀工程師Johnny Ho加入。他們最初嘗試了文本到SQL的應(yīng)用,但關(guān)鍵的認(rèn)知是初創(chuàng)公司必須快速迭代、發(fā)布產(chǎn)品、獲取用戶反饋并據(jù)此調(diào)整,而非在“想法迷宮”中空轉(zhuǎn)。通過(guò)展示產(chǎn)品演示而非演示文稿,他們成功吸引了種子輪投資者,這反過(guò)來(lái)又幫助吸引了頂尖的創(chuàng)始工程師。團(tuán)隊(duì)不斷迭代,最終聚焦于核心理念:改變搜索這一基礎(chǔ)軟件的形態(tài),從關(guān)鍵詞轉(zhuǎn)向問(wèn)題或語(yǔ)音輸入,并提供帶有來(lái)源、可驗(yàn)證的即時(shí)答案,這一理念源于學(xué)術(shù)寫(xiě)作中引用溯源的要求。Perplexity的核心產(chǎn)品原型在一個(gè)周末黑客松(基于前期準(zhǔn)備)后誕生,并通過(guò)小范圍試用迅速驗(yàn)證了價(jià)值。
對(duì)于Perplexity與谷歌的關(guān)系,Arvind認(rèn)為兩者并非直接競(jìng)爭(zhēng)所有場(chǎng)景。谷歌在處理簡(jiǎn)短、導(dǎo)航式搜索(如輸入“天氣”)方面通過(guò)“讀心術(shù)”般理解用戶意圖已做到極致,Perplexity在此難有改進(jìn)空間。然而,谷歌在回答需要信息綜合的復(fù)雜問(wèn)題(如“下雨天去哈佛該穿什么?”)方面表現(xiàn)不佳,這正是Perplexity的優(yōu)勢(shì)所在。谷歌受制于廣告模式,難以對(duì)所有查詢提供直接答案,因?yàn)檫@會(huì)減少鏈接點(diǎn)擊和廣告收入,導(dǎo)致其搜索結(jié)果頁(yè)面日益混亂。Perplexity則嘗試不同的模式,包括與內(nèi)容出版商分享收入,以激勵(lì)高質(zhì)量?jī)?nèi)容的創(chuàng)作,這與谷歌讓出版商依賴AdSense的模式不同。
針對(duì)Perplexity只是“API封裝器”的誤解,Arvind強(qiáng)調(diào),雖然早期版本可以快速構(gòu)建,但公司后續(xù)投入巨大,已建立自有模型、索引和爬蟲(chóng)基礎(chǔ)設(shè)施,并開(kāi)發(fā)了復(fù)雜的、按步驟思考的“研究代理”。即使所有第三方模型停止供應(yīng),Perplexity也能基本維持現(xiàn)有服務(wù)質(zhì)量。公司對(duì)與蘋(píng)果等平臺(tái)合作持開(kāi)放態(tài)度。關(guān)于此前競(jìng)標(biāo)TikTok的愿景,他希望能將信息流變得更具生產(chǎn)力,利用AI進(jìn)行事實(shí)核查,并利用TikTok的搜索入口構(gòu)建下一代搜索體驗(yàn),從而更好地與谷歌競(jìng)爭(zhēng)。
從學(xué)術(shù)界到創(chuàng)業(yè)界,Arvind認(rèn)為核心思維方式有所轉(zhuǎn)變,從重思考轉(zhuǎn)向重行動(dòng)和迭代學(xué)習(xí),但學(xué)術(shù)界的嚴(yán)謹(jǐn)性,如小規(guī)模實(shí)驗(yàn)和批判性思維,在創(chuàng)業(yè)中同樣重要。他對(duì)AI的未來(lái)持“加速主義”樂(lè)觀態(tài)度,希望通過(guò)廣泛可及的AI(如iPhone模式)避免權(quán)力集中帶來(lái)的風(fēng)險(xiǎn)。他認(rèn)為開(kāi)源是制衡AI領(lǐng)域壟斷的關(guān)鍵力量,不斷涌現(xiàn)的高質(zhì)量開(kāi)源模型確保了技術(shù)的普及。展望未來(lái),他認(rèn)為AI的下一個(gè)重大突破可能在于實(shí)現(xiàn)極長(zhǎng)的上下文處理能力,讓AI擁有更持久的記憶和理解力,超越當(dāng)前依賴檢索增強(qiáng)生成(RAG)的模式。
在問(wèn)答環(huán)節(jié),Arvind提到,AI領(lǐng)域仍面臨計(jì)算能力(GPU)短缺的限制,成本是挑戰(zhàn),期待更高效的芯片(如英偉達(dá)Blackwell)和知識(shí)蒸餾技術(shù)緩解壓力。他再次強(qiáng)調(diào)開(kāi)源和透明度(展示來(lái)源和思考過(guò)程)是確保AI倫理和防止敘事被單一公司操控的關(guān)鍵。他預(yù)測(cè),隨著AI能力的增強(qiáng),傳統(tǒng)搜索引擎優(yōu)化(SEO)的重要性將下降。對(duì)于公司戰(zhàn)略,Perplexity專注于短期(季度)規(guī)劃,當(dāng)前重點(diǎn)是擴(kuò)展到天氣、體育、購(gòu)物、旅行等結(jié)構(gòu)化答案垂直領(lǐng)域,開(kāi)發(fā)瀏覽器以整合個(gè)人數(shù)據(jù)實(shí)現(xiàn)個(gè)性化,并探索原生交易功能。他強(qiáng)調(diào)公司文化是快速適應(yīng),從不成功的項(xiàng)目中學(xué)習(xí)并迭代,例如將Perplexity Pages的技術(shù)復(fù)用于Discover Feed。他認(rèn)為量子計(jì)算目前對(duì)產(chǎn)品公司而言為時(shí)尚早。
最后,Arvind分享了他的個(gè)人感悟:創(chuàng)業(yè)路上要保持冷靜,認(rèn)識(shí)到情況“永遠(yuǎn)不會(huì)像看起來(lái)那么好,也永遠(yuǎn)不會(huì)像看起來(lái)那么糟”。他引用埃隆·馬斯克關(guān)于永不放棄的精神作為激勵(lì),強(qiáng)調(diào)堅(jiān)持是成功的關(guān)鍵。
? ? ? ? ?
YC總裁:AI智能體的下一個(gè)突破Manus就在這里 20250408
視頻和全文鏈接:
https://www.bilibili.com/video/BV1bBLyzFET3/
內(nèi)容精讀:
隨著OpenAI、Google、XAI及DeepSeek等平臺(tái)推出可用的AI代理,一個(gè)新的競(jìng)爭(zhēng)者M(jìn)anus也已登場(chǎng),這個(gè)全新的代理式AI平臺(tái)在全球引發(fā)關(guān)注。Manus作為首個(gè)通用AI代理的早期預(yù)覽版已經(jīng)發(fā)布,并迅速激起熱議,被部分人視為中國(guó)繼DeepSeek后的又一重要時(shí)刻,稱贊其為體驗(yàn)過(guò)最令人印象深刻的AI工具和最先進(jìn)的AI計(jì)算機(jī)使用方式。與前輩不同,Manus并非僅是專業(yè)的聊天機(jī)器人,而是致力于成為真正的通用AI代理,但其訪問(wèn)受限,其實(shí)際變革能力仍待觀察。
Manus的核心創(chuàng)新在于其多智能體人工智能系統(tǒng),該系統(tǒng)能處理從旅行規(guī)劃、財(cái)務(wù)分析到文件搜索和行業(yè)研究等多樣化任務(wù)。其運(yùn)作方式并非依賴單一大型神經(jīng)網(wǎng)絡(luò),而是像一位執(zhí)行官,協(xié)調(diào)一個(gè)由規(guī)劃智能體、多個(gè)專業(yè)子智能體(負(fù)責(zé)知識(shí)、記憶、執(zhí)行等)組成的團(tuán)隊(duì)。系統(tǒng)首先分解用戶任務(wù)為子任務(wù),規(guī)劃執(zhí)行路徑,然后分配給相應(yīng)的子智能體。這些子智能體共享上下文,各自擁有專業(yè)領(lǐng)域,并能調(diào)用包含29種集成工具的廣泛工具集,智能決策使用何種工具完成網(wǎng)頁(yè)導(dǎo)航、代碼運(yùn)行或信息提取等任務(wù)。最后,執(zhí)行者代理整合所有子任務(wù)的輸出,生成最終結(jié)果。
該系統(tǒng)由復(fù)雜的動(dòng)態(tài)任務(wù)分解算法驅(qū)動(dòng),能自主拆解復(fù)雜指令。為保證穩(wěn)定性,Manus團(tuán)隊(duì)研發(fā)了“思維鏈注入”技術(shù),使代理能主動(dòng)反思和更新計(jì)劃。其核心模型采用了Anthropic的Claude 3.7 Sonnet,并無(wú)縫集成了YC Company瀏覽器等開(kāi)源工具及Startup E2B的安全云沙盒環(huán)境,具備強(qiáng)大的跨平臺(tái)執(zhí)行能力。Manus擅長(zhǎng)創(chuàng)建旅行行程、財(cái)務(wù)分析、教育內(nèi)容,以及處理結(jié)構(gòu)化數(shù)據(jù)庫(kù)編譯、保險(xiǎn)比較、供應(yīng)商篩選和演示文稿制作等實(shí)際任務(wù)。在衡量AI代理推理、多模態(tài)處理、網(wǎng)頁(yè)瀏覽和工具使用的Gaia基準(zhǔn)測(cè)試中,Manus得分高達(dá)86.5%,超越了OpenAI研究平臺(tái)的74%,接近人類平均水平的92%。
盡管表現(xiàn)亮眼,Manus也引發(fā)了關(guān)于應(yīng)用層AI初創(chuàng)公司實(shí)質(zhì)上是否為“封裝器”的討論。批評(píng)者認(rèn)為Manus只是將現(xiàn)有基礎(chǔ)模型與工具調(diào)用拼接起來(lái)。然而,這種觀點(diǎn)忽視了許多成功的AI產(chǎn)品(如Cursor、Windsurf、Harvey)也采用了類似模式,通過(guò)集成現(xiàn)有LLM、API和特定領(lǐng)域工具來(lái)創(chuàng)造價(jià)值。成功的封裝器通常通過(guò)直觀UI、專有評(píng)估、精細(xì)微調(diào)和精心設(shè)計(jì)的多智能體架構(gòu)脫穎而出。Manus聯(lián)合創(chuàng)始人亦表示,他們選擇與模型開(kāi)發(fā)正交的路徑,樂(lè)見(jiàn)新模型的發(fā)布。
Manus的多智能體編排帶來(lái)了成本優(yōu)勢(shì)(每任務(wù)約2美元,低于某些集成競(jìng)爭(zhēng)對(duì)手),并提供了更高的透明度和用戶控制,允許用戶檢查、定制甚至替換子智能體和工具。其暴露文件系統(tǒng)的特性讓用戶能直觀了解代理工作過(guò)程,預(yù)示了未來(lái)桌面AI應(yīng)用的潛力。然而,其局限性也存在,如任務(wù)復(fù)雜時(shí)跨代理協(xié)調(diào)難度增加,且其當(dāng)前的優(yōu)勢(shì)(用戶體驗(yàn)、微調(diào)、集成)易被模仿。封裝器模式雖能快速部署和迭代,但也易受API定價(jià)或供應(yīng)商政策變化的影響。最終,關(guān)鍵挑戰(zhàn)并非封裝器模式是否可行,而是如何為產(chǎn)品建立可持續(xù)的差異化,例如通過(guò)投資難以復(fù)制的專有評(píng)估、深度嵌入用戶工作流或集成獨(dú)特平臺(tái)與數(shù)據(jù)集。歸根結(jié)底,AI領(lǐng)域的成功往往不取決于重新發(fā)明基礎(chǔ)模型,而在于誰(shuí)能將現(xiàn)有模型有效整合,創(chuàng)造出用戶真正喜愛(ài)的產(chǎn)品。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.