Open AI作為AI時代的科技先鋒,每一個動向都備受關注。但是吃多了“網紅化”帶來的流量紅利,Open AI似乎很難像學者一樣老實待在實驗室了。
馬斯克犀利批判,AGI團隊負責人黯然離職,光環下的深度推理大模型性感卻似乎遙不可及。
中國AI行業在ChatGPT的刺激下這兩年集體追趕預訓練大模型,對資源、數據、算力大筆投入。
面對Open AI拋出的新動作,從預訓練模型到深度推理模型轉技術路線,跟或不跟?選擇發展應用還是死磕大模型技術?這些都成為全球AI圈新的選擇題。
01
李開復揭秘o1模型上線幕后
Open AI越來越喜歡搞大新聞。
2024年9月,在ChatGPT4o模型推出沒有幾個月,Open AI就發布了號稱“迄今為止功能最強大”的o1系列模型,其首席執行官?山姆·奧特曼稱這是“新范式的開始,人工智能可以進行復雜推理了”。
這就是所謂的“深度推理模型”。簡單說,它最與眾不同的是,回答之前會思考,產生一個很長的內部思維鏈,逐步推理,模仿人類思考復雜問題的過程。
o1模型是首個通過大規模強化學習算法訓練的模型,其對“算法”和“算力”的要求,可能更甚于“數據”。
如果預訓練模型是 “數據貪吃蛇”,那么深度推理更需要“算法大師”,并同樣是“算力消耗大戶”。
有人說,“以前的預訓練大模型是學習數據,o1 更像在學習思維?!?strong>預訓練模型是靠海量數據和算力堆砌的高級版信息搜索和提煉概括,推理則被認為是 AI實現人類或超人類水平智能的關鍵。o1模型似乎離真正的“人工智能”更近了一步。
Open AI猶如新的大殺器,攪亂全球大模型圈。
從 OpenAI 公布的評測結果來看,o1在 Codeforces 編程競賽中超過了89%的參賽者,在美國數學奧林匹克競賽的資格賽中名列全美前500名,在物理、生物和化學問題的基準測試中超越了人類博士水平的準確率。
之前Open AI 將 AGI(通用人工智能)劃分了五個發展階段,其中第一級「ChatBots」聊天機器人,典型的就是ChatGPT;第二級「Reasoners」推理者,解決博士水平基礎問題的系統。o1模型發布代表Open AI在向外宣稱,其實現了AI能力的躍遷,達到了人工智能發展階段的第二級。
如果真是這樣,這也將意味著Open AI再次大幅領先,把其他所有還在發展預訓練模型,追趕ChatGPT路線的一眾大模型廠家再次甩在身后。
目前o1僅有少數模型對高級別付費用戶開放。但根據實測來看,o1的水準可能差強人意。
例如,o1在很多方面甚至不如 GPT-4o,僅支持文本,不能看,不能聽,沒有瀏覽網頁或處理文件和圖像的能力。還有內測的 AI 安全研究公司 Apollo Research 發現,o1 可能會假裝遵循規則完成任務。數學家陶哲軒直言,“使用 o1 就像在指導一個水平一般但不算太沒用的研究生?!?/p>
更有甚者,蘋果日前放出了一篇論文,暗示了Open AI的o1模型不會推理,這篇論文論證了例如給小學數學題加句“廢話”插入無關信息,就會干擾推理。
Open AI用o1模型“卷”同行,真的是技術能力的躍遷嗎?
近期零一萬物CEO李開復在一則公開對話里透露的“八卦”道出了內幕。
他直言,“我剛從硅谷回來,聽說GPT5的訓練不太順利,因為10萬張集群蠻難搞定的。但是Open AI又要融資,GPT5沒有出來,沒有一個由頭讓投資人投資,因為大家都在追趕,有些也快趕上了,所以他只有祭出了一個內部準備不發布的o1?!?/strong>
不過李開復并沒有過多評價o1模型,對Open AI的評價依然很高,他援引Open AI內部人士說法,Open AI還有很多“好東西”沒有發布,很多已經做出來了。
Open AI原本定位是一家非營利組織,但它正在迅速轉變為營利性公司。近期Open AI 以 1570 億美元估值融資 66 億美元,成為硅谷史上最大的一次融資。據《華爾街日報》報道,微軟和OpenAI都聘請了投資銀行,以咨詢重組后的治理權和股權安排。
初心之變的背后,不僅有o1模型的倉促面世。今年以來,Open AI已經有十余位中高層領導先后出走。就11月9日,上任OpenAI研究與安全副總裁僅3個月后,OpenAI 安全系統團隊負責人翁荔(Lilian Weng)宣布將離開O這家自己已經工作近 7 年的公司。
這些跡象都在表明,Open AI正在從“學者”變成了“網紅”,似乎一刻也不想離開熱搜。但如果企業一直沒有實質性技術進展,人們的閾值將會不斷改變。
02
大模型競賽轉向“務實化”
在大洋的另一邊,中國大模型公司走出了另一條道路。
在追趕算力和數據方面,正如李開復所言,許多同行包括中國公司,已經追平ChatGPT4o。
例如,騰訊的混元大模型今年不斷升級,根據官方資料,相比前代模型,最新的混元Turbo性能顯著提升,訓練效率提升108%,推理效率提升100%,推理成本降低 50%,效果在多個基準測試上對標GPT-4o,且第三方測評居國內第一。
李開復的零一萬物也在10月份官宣,其新的預訓練旗艦模型 “閃電”,在國際權威盲測榜單 LMSYS 上超越了 Open AI 。
預訓練模型對大數據和算力投入要求極高,再加上新的o1模型面世,還是有人動搖了。近期業內關于“中國AI六小虎”(智譜AI、零一萬物、月之暗面、百川智能、MiniMax、階躍星辰)中有公司要放棄大模型的消息喧囂塵上。
但是許多互聯網頭部公司仍在堅持投入大模型技術。根據最新財報,騰訊一個季度在研發上的投入就高達179億元,阿里也高達142億元。兩家公司不約而同強調,要繼續投入AI。
觀察發現,中國大模型行業已經出現了兩種發展路徑——
第一種,例如騰訊、阿里、字節跳動、百度這樣的互聯網頭部公司,仍在堅持預訓練模型這一戰略級技術路線,并持續投入,走出了“內部應用提效+外部行業輸出”的務實路徑。
在巨額投入后,技術快速成熟,這些大廠的大模型能力不僅追趕上ChatGPT,其大模型技術還在內部和各業務結合落地,帶動業務新發展,例如百度的搜索、騰訊的廣告和SaaS產品、阿里的電商等業務都已經受益于AI提效升級。阿里巴巴在最新財報表示,AI收入連續五季度增長。
同時,這些大廠把成熟的大模型算力和技術向行業輸出,一方面實現新的商業化,另一方面助力各行業搭上AI的快車,帶動整個中國人工智能的發展。今年中國快速出現大模型技術降價潮,不得不說正是頭部大廠們通過資源投入快速帶動了行業發展,是件好事。
第二種,中小型創業公司同樣務實,聚焦發展各類AI應用創新。
以“大模型六小虎”為例,它們在今年前10個月的技術進展中,紛紛展示了各自在AI應用領域的成果。
月之暗面的Kimi探索版具備AI自主搜索能力,智譜AI的AutoGLM實時語音互動應用開始內測,百川智能推出首款AI助手“百小應”,MiniMax將發布端到端實時語音通話API產品……
這些應用不僅豐富了AI產品的形態,也為創業公司們帶來了商業化的可能。
營銷數據也從一個側面說明了國內創業公司在AI應用商業化中的大膽試水。有數據統計,今年前三個季度,各大AI應用在全網的廣告投放支出超過了3億元人民幣。其中,kimi智能助手以1.99億元的投放金額位居榜首,遠超其他競品。
其實硅谷的AI創業者同樣在如火如荼進行應用和產品的創新。周鴻祎近期公開提到,硅谷“沒有人在賣大模型了,大家都在賣產品?!卑l展垂直化應用就是用AI聚焦去解決一個痛點問題。
“大模型就像一個發動機一樣,它隱身在很多產品和解決方案之中。模型只是能力,模型不是產品。”周鴻祎直言。
如此,中國大模型發展的現狀圖已經清晰:大廠做底層能力的投入,并且快速向行業輸出能力,而更多AI時代的創業者越來越年輕化、團隊微型化,他們聚焦場景,創新各類C端和B端的AI產品應用。
無論“網紅化”的Open AI未來商業化之路如何,我們都要肯定,這家公司為人工智能發展拉開了時代的大幕。
從大模型底層能力,到應用創新,中國人工智能行業已經快速加入了這一輪科技競爭的浪潮。從中國頭部公司用一年時間追趕上美國預訓練模型的速度看,我們對未來中國企業參與第二級甚至更高階的人工智能發展競爭都抱有信心。
正如李開復預測:“未來兩年,AI將會有驚人的變化?!?/p>
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.