當杰夫·辛頓在2024年獲得諾貝爾獎的時候,他或許會想起12年前的冬天,來找到他的那家叫百度的中國公司。因為是百度最早發現了他關于神經網絡研究的價值,并極力邀請他加盟。
2012年12月初的一天,美國滑雪勝地太浩湖的一家賭場酒店里,杰夫·辛頓和他兩名學生迎來了四方的競拍者,他們分別來自百度、谷歌、微軟和DeepMind。
辛頓名下的這間叫DNN research公司,其實沒有任何實體業務,它唯一的資產,其實就是這三位學者腦中的學識。
可能是覺得中國太過于遙遠,當時已經年近七旬的辛頓,最后接受了谷歌的出價。
但在彼時的大洋彼岸,中國的信息產業的諸多企業中,幾乎沒有人知道發生過一件這樣的事情,更不知道有一家中國企業已經開始對人工智能的探索。
客觀講,拍板參加這次競拍的百度創始人李彥宏,是一個有方向感的科技企業家。在過去十幾年里,他的很多關于AI發展方向的判斷,都對產業產生了價值。
但也有人不認同他的一些判斷,于是,邊爭論邊發展,直至逐漸被驗證,成為共識,成為這個行業的有趣現象。
那么,我們不禁要問,李彥宏的方向感,從何而來?
——導語
01
應用來了?!
2024年的百度世界大會,李彥宏的主旨演講,從一個技術問題開始。
這個問題,叫“AI幻覺”,它特指在生成式人工智能時代,模型生成的內容與現實世界事實或用戶需求不一致的現象。
你也可以簡單的理解為,大模型在一本正經的胡說八道。
李彥宏用一個四層的天壇圖片舉例,告訴臺下的聽眾——真正的天壇只有三層,但模型往往會自動生成一幅四層的圖片而不自知。并且,這是所有的生成式模型都會遇到的問題。但在真實世界里,這類問題往往出現的更加隱蔽且詭異,從而給用戶更多的困擾和誤導。
李彥宏告訴觀眾,百度用RAG(檢索增強)和Image based RAG(/基于檢索增強的文生圖)的技術,改善了文字和圖像生成中的幻覺問題。
而之所以把這個技術細節放在這次重要的演講的開頭,和李彥宏接下來要作的一個判斷有關——他認為,“AI幻覺”直接導致了“(生成式)多模態大模型其實還沒有什么成規模的應用出來”。
故而,在他看來,消除幻覺既是大模型領域在過去24個月實現的最大進展,也應該是AI應用出現爆發的起點。基礎模型的能力已經就緒,行業將迎來一個物種大爆炸的應用爆發期。”
如果仔細的研究李彥宏過去18-24個月的講話,會發現“應用”是一個出現頻率極高的詞匯。
22個月前,也就是早在2023年3月,李彥宏就提醒行業“不要重復造輪子”,并表示應用才是大模型真正的機遇。
11個月前,也就是2023年12月16日,李彥宏更直接的表示了自己的焦慮:““我多多少少有點著急”,他在與極客公園的對話中談到:“整個國內的AI大模型行業,現在其實卷偏了。實際上,眼下更應該抓住的機遇,是大模型原生應用”。
而到了今天,他把2024年的百度世界大會的主題詞定為“應用來了”,簡單、直接、強硬。
在實際行動方面,他在百度內部推動了“百度所有業務,都要根據?成式 AI理念重構,重做?遍原來的產品”;而在外部,為了給自己心目中的“應用潮”再加一把力,他還在會上展示了遴選出來的Top100智能體和Top100產業應用。
在當下,談大模型原生應用的當然遠非僅李彥宏一個人,但如此執著且狂熱的業者,也著實不多見。
在筆者看來,李彥宏急于推動大模型的應用落地,并非因為大模型已經完美,而是他的底層認知決定的。
早在21世紀的第一個十年,他就反復的釋放一個觀點:中國由于是(網民人數)的互聯網第一大國,就有機會先遇到問題,進而有機會先去解決這些問題,從而在應用創新上實現跨越。
而這已經變成了現實。
在近年,他把這個觀點濃縮成一個詞匯:“反饋式創新”,在很多場合提及——只有真實世界的實際反饋才能持續驅動創新。
這也解釋了,為什么他始終認為,在大模型通往完美的路上,急需百萬級的“應用”作為導航儀,去探索大模型的能力、產品與市場的契合度(PMF)。
但是,真實世界這次會按照他的判斷而做出改變嗎?
02
方向感
當ChatGPT橫空出世后,在中國出現了百模大戰,數百家公司紛紛投入大模型這個賽道,資本的眼神都是火熱的。
在很多人為這種圖景叫好、上頭的時候,李彥宏唱了反調,他認為——百模大戰造成了社會資源的巨大浪費,尤其是算力的浪費,這種局面不可持續。
但極多人當時并不認同他的觀點,他們的理由是:只有150個員工時的oepnAI就做出了ChatGPT,那我們為啥不能 搏一搏?
事實是,雖然openAI起了個大早,但現在各大巨頭的大模型都趕上來了。
這反映了一種現象——巨頭公司往往在行業出現突破式創新時會因為體量過大、反應較慢而落后半步,如IBM、微軟、甲骨文都犯過這樣的錯誤,但一旦龐大的資源和組織被真正動員起來,很容易趕上并碾壓初創公司。
這也幾乎注定了,大模型不是一條對初創公司友好的賽道。
國內的事實似乎也說明了這一點,有統計顯示,截至2024年4月底,國內共計推出了305個大模型。而截至5月16日,只有約140個大模型完成了生成式人工智能服務備案,不足總量的一半……其中一小部分或許是因為用于學術研究,但大部分則死于彈盡糧絕。
事實也是,由于大模型賽道的天花板很高,現在的大模型技術距離理想情況還相差非常遠,所以模型要不斷快速迭代、更新和升級,不斷滿足用戶需求,以及降本增效……這意味著巨大的、無窮無盡的投入,更直接導致了AI還沒有形成生產力,但賣算力卡的英偉達卻成為全球市值老大。
對于此,巨頭們尚且身不由己,初創企業怎么獨善其身?
再舉一個例子,李彥宏和很多行業觀點對撞的一個判斷,是他認為:商業化模型比開源模型更有潛力和價值。
在“開源模型”十分盛行、部分開源模型宣布取得了比閉源模型取得更好的打榜成績的當下,“開源派”聲勢浩大。甚至,扎克伯格這種大佬還親自撰文——《開源AI是前進之路》,親自下場為開源站臺。
怎么看待這個問題,這里,筆者要講兩層意思。
第一層:“開源”在一開始可能是更快、更便宜的,但更有商業潛力的還是商業化大模型,因為最后拼的是產品力。
例如,在差不多10年前,分布式計算和分布式存儲開始大行其道,國內大部分存儲企業都去用免費的分布式系統,只有兩家企業——華為和曙光,決心自研全棧、閉源的分布式存儲體系。
10年過去了,這兩家有自研體系的企業牢牢占據了國內分布式存儲市場的頭兩名,而那些用開源分布式的企業,受限于對底層技術的控制能力有限、bug多、沒有技術支持等方方面面的原因,始終沒法打入頭部市場。
第二層,開源是有標準的,在AI語境下,“偽開源”可能更多。
在軟件時代,開源相對比較簡單,能夠拿到源代碼、二進制代碼就算開源。
開源的經典精神是——如果開發人員無法學習、使用、修改和共享特定程序,則該程序就不能被稱為開源項目。
根據這個邏輯,一些專家認為,Meta 和谷歌的免費大模型(任何人都可以檢查和調整)并不是真正的開源,因為“許可證限制了用戶可以對模型做什么,而且訓練數據集不公開”。
李彥宏的看法則是:“開源模型基本上是?堆參數,?們不知道這些參數是如何推導出來的,也?法更改這些參數,因此不會對世界各地的?產?影響,也不會讓世界變得越來越好。”
事實上,有些模型的開源只是為了營銷,一位專家諷刺的說:”將模型描述為開源可能會使它們被認為更值得信賴,即使研究人員無法獨立調查它們是否真的是開源的。
但是,在這些爭論成為公眾話題前至少半年,李彥宏就有明確的觀點:在商用層面,閉源是終局模式,因為閉源遠比商業效率高。
簡單說,免費的就是最貴的。
這就好像你去A店,免費送你一個車的底盤,但你得自己配車殼子、發動機和輪胎,還要讓它們組裝起來可以正常運轉;而B店提供二手的整車,且因為經營規模大,單車價格能打下來,還提供服務和救援。
對于不是汽車機械師的99%的人來說,選擇B店無疑才是符合需求的。對于AI應用創新企業來說,同樣的道理是——企業不用也不該花錢去打磨大模型,應該把這部分資源投入到研發大模型的創新應用上來。
一個有趣的現象是,有時候李彥宏明知自己的觀點還不是行業共識,但他還是愿意拋磚。
例如,在智能體方面。
百度也在智能體方面發力,李彥宏對于智能體的看好也由來已久,他認為——目前,搜索和大模型的結合,更多應該是在智能體上。
不過,李彥宏說對智能體的判斷時,還說了一句“冷話”:“智能體現在還并不是一個行業的共識,只是百度下的一個賭注。”
這句話看似突兀,仔細深思,又覺得李彥宏有李彥宏的道理。
千行百業競逐智能體,但真正有幾家公司真懂智能體?是真的為了成就智能化而做智能體?
如果問的再尖銳一點,大部分企業對智能體的研發能投入能占到總研發經費的20%嗎?10%?
恐怕一百家里沒有一家。
這就跟我最近追的《小巷人家》這部劇的情節一樣——莊家堅持要讓一雙兒女上高中、考大學的時候,大家嘴里都說“蠻好蠻好,大學生有前途”,但是一回頭,還是安排自己的子女上技校、上中專,因為好就業。
等到一夜間情勢變了,中專、技校不再包分配的時候,這時候大家才是真的意識到,莊家的決策做的太對了,自己在信息繭房里呆的太久,耽誤了兒女的前程。
可以說,直到這一刻“共識”才形成,但絕大多數人都無法受益于這個共識,因為他們在“等”共識的時候,時機已經悄悄錯過了。
歷史從來不是由共識推動的,而是由先于共識形成時就做出獨立判斷的人推動的,共識只是塵埃落定后的結果。
03
創始人模式的底層邏輯
如果說以上關于卷應用、閉源、智能體的觀點是顯性的,那么,也必然也有解釋這種方向感的隱性因素。
恰好,硅谷最近熱議的“創始人模式”,似乎為我們尋找隱性的底層邏輯提供了線索。
這個定義,出自YC創始人Paul Graham的一篇文章。
它的核心觀點很簡單——相較于只通過下屬掌控公司的職業經理人,親力親為的創始人更有利于一家大公司的發展。因為創始人具有三個職業經理人無法具有的特質——
- 創始人相當于公司的親生父母;
- 可以完全決策如何作出改變;
- 知道如何重建公司;
說“親力親為”,是不過分的。仔細想想,和李彥宏同年齡段但還在一號位上的企業家,著實已經不多。
對于創始人模式的第一條,在十幾年前,我曾經和李彥宏本人在一次出差期間,有一個短暫的交流。我問他為何在有些事上堅持親力親為,他的回答是:“因為你們中的任何人都有可能離開,但我必須留在這里與百度同生共死,無法離開。”
“創始人模式”中的第二條也適合于百度,那就是“可以完全(自主)決策做出改變”。
我們都知道,百度在自己的第二個10年,也就是移動互聯網時代,發展的路徑可謂是跌宕起伏,也錯過了不少機會。
但是,在國內產業界沒有任何企業看出AI的潛力(大部分人是在2016年也就是阿爾法狗戰勝人類棋手時,才意識到AI的潛力)的2010年,百度就已經將NLP研發部門從各個業務線中獨立出來,一面攻堅前沿技術,一面追求業務落地。
事實上是,早在2006年,百度就已經有員工自發的把人工智能技術用在產品的提升上。
換言之,百度提前十幾年就開始走自己的AI之路,而且投入了非常高的研發經費,除了“創始人模式”之外,沒有任何一種可能性能讓一個企業開始這種高昂的、看似無邊無際的遠期投入。
第三,我們前面已經說過,李彥宏推動了百度所有產品“用AI重做一遍”,這與文中的觀點三即——知道如何重建公司,可謂嚴絲合縫。
從微觀角度,我不懷疑個人興趣或性格影響了李彥宏對AI的執著;但從宏觀角度,如此執著的追求,倒不如說AI是他的欲望、信仰和對未來的寄托。
《創始人模式》里有一句話說的很好——他們(創始人)所做的事情,使他們被許多人視為古怪,甚至更糟。但(你要)看看創始人已經取得的成就——他們是在逆風而行的情況下取得的這些成就。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.