陳慶春/文
在Scaling Law(規模與性能的冪律增長規律)若隱若現、似要消失,大模型越來越難找到代際感的今天,中國獨有的規模優勢或許將在人工智能領域“涌現”。
有人正努力讓人工智能更像人:2024年世界人工智能大會(WAIC),爆發式展示了25款人形機器人,且都被冠以“具身智能”的身份,也就是機器人的身子被AGI(通用人工智能)技術賦予了智慧的大腦。
有人努力讓AI落入現實: 支付寶推出智能助理,問一問就能獲得訂票、問診、查旅行攻略等超8000項數字生活服務; 擁有7億用戶、1100萬應用的釘釘也已經跑出來了50萬個AI助理; 聯想則推出了內嵌智能體、能與用戶自然交互的AI PC。
百度CEO李彥宏所言“不要卷大模型,要卷應用”在網上被熱傳,螞蟻集團董事長兼CEO井賢棟則說:“在人工智能時代,我們在探索,讓AI像掃碼支付一樣便利每個人的生活。”
在AIGC(生成式人工智能)大模型技術苦苦尋找應用場景時,中國擁有超大規模用戶的平臺紛紛下場了。或許還稍顯緩慢,但平臺的集體出手與探索,讓我們有理由期待中國人工智能被動跟隨的局面能被改寫,特別是在連接個體生活應用的端側,或將掀起人工智能發展的第三波浪潮。
第三波浪潮:
大模型即將接管生活
Scaling Law是被人工智能領域普遍接受的冪律增長,即:語言模型的性能隨著模型大小、數據集規模和訓練計算量呈現冪律關系。這意味著在一定范圍內,增大模型規模和數據集規模,能夠顯著提升模型性能。也就是業內常說的:模型越大,性能越好。
但最近半年來,Scaling Law明顯放緩,OpenAI也不得不承認,GPT5.0版本要等到明年才能推出。而造成這一現象的根本原因在于,全球普遍出現了算力和數據的供給短缺,特別是數據規模量陷入了極大的瓶頸。機器吃不飽,就導致了大模型的性能輸出側無法完成高質量輸出。
在這種情況下,大模型就一直無法解決機器幻覺、高錯誤率的問題。MiniMax創始人、首席執行官閆俊杰認為,GPT 4存在30%~40%的錯誤率,國內大模型整體上也存在60%~70%的錯誤率,要想讓AI從一個輔助人類的工具到能獨立完成工作,為社會創造更大的價值,最核心的一點是整體降低大模型的錯誤率。
大模型技術的發展似乎陷入了一個惡性循環的怪圈,大模型的性能提升需要大量使用后的數據投喂,但大模型的錯誤率又讓人們不敢大規模使用。如何破局?
業內還發現一個現象,將大模型縮小規模至特定的專業領域,Scaling Law依然在發揮價值,向專業大模型投喂專業知識庫,模型依舊呈現能力的巨大提升。比如多模態領域近一年來進展便神速,在今年WAIC現場,商湯展示了可控人物視頻生成大模型Vimi,可將靜態圖片生成1分鐘唯美視頻;支付寶也發布了多模態醫療大模型,并將與20家機構聯合發起AI醫療共建計劃。
Vimi 使用情深深雨濛濛視頻片段作為控制生成的長視頻
到今天為止,大模型并不是越大越好,也不是只有將性能力發展到驚艷才能使用。如果縮小規模,放至特定的場景使用,也可以實現數據規模與性能提升的良性循環。
回顧大模型的發展不過兩年時間,已掀起了三次浪潮,且越來越鎖定特定場景。
第一波浪潮,是OpenAI訓練的大語言模型的橫空出世,帶給人類的震撼是,機器可以跟人用自然語言對話,擁有人的邏輯思考、推理、總結、規劃以及多模態生成能力,中國廠商隨后全面跟進,也生長出多個大語言模型創業公司。這一波的應用以聊天對話框的方式出現,如國外的ChatGPT,國內的文心一言、騰訊元寶、通義、豆包、Kimi等。
第二波浪潮,微軟、谷歌基于大語言模型做系統重構,發起生產力工具端的變革,如微軟在Windows、Azure系統中全面應用Copilot智能體調用大模型能力,以及對PC這一生產力工具的系統級改造。谷歌則用來全面改造搜索工具。中國企業百度也在第一時間用自研大模型重構了所有業務,之后釘釘用AI助理連接了B端企業場景應用,發起了更廣泛的智能化場景改造。這波浪潮最大的特點是聚焦工作場景的智能提效。
第三波浪潮,開始觸及普通人的生活,最先讓人感到變化的是蘋果。蘋果發布的蘋果智能(Apple Intelligence),從技術上看并無驚艷之處,但它帶來的沖擊在于連接了個體生活。比如你可以讓Siri給你出個菜單,制定機場接人的最佳路線和時間,找到上周與朋友一起烤肉的照片,設計一下自己的花園,等等。
緊隨其后,華為發布了“鴻蒙原生智能”( Harmony Intelligence ),應用路徑與蘋果異曲同工。小藝智能體就類似Siri,成為個體生活中的助理,比如小藝把攝像頭看到的世界讀出來,幫助視障用戶,“看清”身邊的世界。
蘋果與華為,在與人生活最緊密的端側,打開了大模型在生活應用中的巨大想象力。但遺憾的是,這些設計想要真正落地還得等到明年了。
在生活應用端,還有一個超級App正悄悄發力。支付寶今年4月在首頁設置了下拉入口,只要向下一拉,“智能助理”就能被喚出。這個“智能助理”類似于Siri,在融入支付寶平臺生態后,就可以通過說話,連接出行、健康、便民服務、吃喝玩樂、消費管理等支付寶已有的生活服務。
比如“點單”這個功能,只要對智能助理說一聲“我想點一杯瑞幸的大杯冰拿鐵”,AI便會進入小程序自動下單,用戶確認并付款后,就能到附近的線下門店取到咖啡。
在特定場景內、使用特定的專有知識庫、實現特定的功能,Scaling Law也會繼續發揮價值,讓特定場景的智能助理通過數據投喂變得越來越聰明。
大模型融入人類生活的想象空間,已然打開,并有理由期待其獲得快速發展。
人類開啟了AGI大模型技術的第三波浪潮,但并不意味著第一波浪潮和第二波浪潮的終結,三者并駕齊驅,在未來的發展過程中,有可能一浪更比一浪高,我們逐浪前行。正如AI與量子計算的相輔相成,互相促進。
這意味著,在第一波浪潮中落后的企業,有可能通過逐浪第二波和第三波浪潮,變成領先者。過去我們曾糾結于中國人工智能落后美國1-2年,現在重新打開了視野。
平臺企業的機遇:
重構與創新
第一次浪潮掀起的第一波應用,許多已走向消亡。
一家名為“DANG!”的網站,收集了大量已經死亡的基于大模型開發的應用,大約已有700多家。這張網頁被稱之為“AI Graveyard(AI墓地)”,名單上幾乎全部是創業公司套殼大模型的應用產品,文生圖、文生視頻、代碼優化等。
AI墓地的出現,說明了兩個問題:
第一,基于大模型自身的性能,單獨做出一個應用,還支撐不住,next big thing仍未出現;超級App擁有廣泛的典型剛需場景,與大模型結合或可產生質變,而大模型原生應用的爆發點,也許來源于舊技術未滿足的需求。
第二,大模型因涉及數據、算力的規模性需求,草根創業難占優勢,大模型天生對平臺企業友好。
平臺企業擁有規模用戶和應用場景,每天產生大量數據,也更能支撐大量算力的成本。目前,平臺企業投資大模型創業公司時,大多都采用了算力投資的方式,容許創業公司使用算力資源,從而獲得相應的股份。
所以,在第二波和第三波浪潮中,那些錯過第一波浪潮的大企業更容易贏得反轉。微軟并不自建大模型,谷歌的Gemini大模型也落后于ChatGPT,但兩者均已受益于大模型。微軟自不必說,納德拉自稱“一直都與技術范式的發展共進步”,宣布推出AI PC后其市值創歷史新高。谷歌在大模型的加持下,搜索、云等業務均實現了雙位數增長。
大模型對于大企業來說,正是一次難得的業務重構的機會。釘釘對于AI助理的使用,吸引了大模型創業公司和機器人創業公司等前沿技術創業公司的加入,也給傳統企業的智能化帶來了新的想象力; 浙江衛健委利用支付寶“AI就醫助理”解決方案,推出全國首個數字健康人“安診兒”,服務覆蓋掛號、咨詢、用藥、健康科普等26個環節,也已應用在浙江省內上千家醫療機構。
第二波浪 潮中的大企業,已經獲益匪淺,相對于仍在焦慮地尋找應用、以求增長的大模型企業(包括OpenAI在內)來說,他們的路徑卻相對扎實。 即便是身處第三波浪潮、還未落地的蘋果公司,也因大模型加持下的路徑規劃而獲得了新的增長。
蘋果在演示被AI升級的Siri時,所舉的例子是“如果郵件通知了一個臨時會議,那么我還能趕上接下來女兒的演出嗎?”看上去并不性感,但其市值的高漲卻說明了外界的期待與看好——人人期待AI能從“通用”走向 “有用”,服務更多普通人的生活。
最近一些國內國民級產品的AI布局,也有相似的趨勢。在支付寶智能助理已實現的功能中,就包括“查查上個月我花了多少錢”、“附近三公里最便宜的充電樁”、“幫我點一杯霸王茶姬的奶茶”、“幫我查明晚七點后從上海飛北京的航班”等服務。
從便捷到智能,從通用到有用的產品轉型,這條戰略訴求,說起來容易,做起來卻很難。
生活的場景遠比企業辦公場景復雜。拿支付寶來說,每天有超5億用戶用它日常出行,每3人中就有1人通過支付寶看病就醫,每天還有近7億人次使用非金融的生活類服務。所以,AI對支付寶的煥新,并不是簡單加入一個自然語言聊天對話框那么簡單,它需要的是科技對整個服務系統的重構。
幾億用戶來了,支付寶該為每個不同的個體提供什么樣的個性服務?首頁下拉就能打開的智能助理,僅僅是個入口,也只是個開始。
一個生活服務平臺,接入智能助理時,需要具備三個條件:第一足夠了解個體用戶;第二擁有大模型世界知識與現實生活知識;第三具備服務能力、規劃能力、鏈接能力,能幫個體真正解決實際問題。
此外,在整個重構過程中,還需要平臺不斷創新。比如特別是對于平臺企業來說,無法調用商用生活類小程序數據接口時,那它怎么做到精準下單呢?支付寶的解決方案是,創新研發了ACT(Transformer for Actions)智能服務技術,讓智能助理具備屏幕感知與仿真執行能力,就像讓AI有了“眼睛”和“手腳”,模仿人去小程序下單付款。未來我們有理由期待,AI能夠連接支付寶的400萬小程序,讓我們能實現一句話點餐、掛號、訂票。
與生活相關,便與瑣碎相關,每一個細節都必須精耕細作,對于平臺企業來說,難度可想而知。不過,一旦業務重構完成,AI的智能助理會更具想象力,它能讓每個人都用到大模型能力,從精英到普通人,從年輕人到老年人,實現AI的人人可享——這才是AI改變世界的樣子。
移動互聯網誕生10年后,才迎來智能手機的爆發式增長。AGI時代才剛剛開始,我們應該給技術一段時間來孕育更大的改變。
中國人工智能開啟突圍模式
移動互聯網時代,中國誕生了微信、支付寶、抖音、美團、小紅書等超級應用,并擁有全球產銷量規模最大的手機、PC等智能終端產品。在B端,中國制造業規模已連續11年位居全球第一,擁有最完整、最豐富的產業鏈應用場景。
中國還在不斷開拓新的AI應用場景, 中國新能源汽車 產銷量已連續9年全球第一。據香港“對比法”技術市場研究公司最新的預測,2024年中國的純電動汽車銷量將是北美的4倍。AI加持的智能駕駛,無疑也值得期待。
在機器人領域,中國的進階拓展也一直處于領先位置。2023年,中國工業機器人銷量已占全球一半以上,連續10年居世界首位。生活服務型機器人的產銷量亦在穩步上漲。
如同移動互聯網時代,在人工智能時代一旦進入應用階段,中國依然擁有無可比擬的規模優勢。百度、釘釘、支付寶、華為等平臺企業的責任,就在于調動中國的這種優勢,在B端和C端掀起的兩次浪潮,連接千行百業、千家萬戶。
百度李彥宏說,超級能干的應用比只看下載量的超級應用可能要更重要,只要對產業、對應用場景能產生大的增益,整體的價值就比移動互聯網要大得多。李彥宏希望,用大模型提效每一個行業、每一個場景。
釘釘集團總裁葉軍稱,釘釘堅持開放底模型,希望釘釘站在巨人的肩膀上,為每一個企業探索大模型的應用場景,從客戶場景出發,探索大模型最務實的落地方式。
螞蟻集團井賢棟稱,希望AI像掃碼支付一樣便利每個人的生活,讓AI走進尋常百姓家。除了支付寶智能助理,螞蟻集團也將推動大模型落地重點聚焦在醫療、金融兩大垂直行業。越復雜的領域,越需要生產力工具變得簡單。
無論是行業、企業還是個體生活,大平臺對大模型技術的應用場景開發,獲得的海量數據,又會反哺大模型技術的提升。OpenAI奧爾特曼曾感慨,目前中國正有大量模型在被訓練,這種趨勢會持續下去。他預計中國會有自己不同于世界其他地方的大模型。
未來,一切反轉皆有可能。憑借豐富的大模型場景應用,馬斯克的大模型能力有可能超過OpenAI,而拉長時間周期,像移動互聯網那般,中國人工智能應用也有望實現突圍。或許說,我們都期待這樣的突圍。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.