正月十五剛過,AI圈就有大事發生:2月12日,CNBC引述知情人士爆料稱,百度計劃在今年下半年發布下一代人工智能模型Ernie 5.0,將在模型多模態能力方面有重大增強。次日凌晨3點,OpenAI首席執行官Sam Altman就表示即將發布GPT-4.5和GPT- 5,重點是GPT- 5將免費開放。與此同時,文心一言宣布:將于4月1日0時起全面免費,PC端和App端都可使用文心系列最新模型。
中美AI行業兩大領軍企業為何同時宣布免費?全面開放大模型有什么樣的深層次原因?全球兩大頭部AI產品免費開放,對AI產業有哪些影響?下面K哥談談自己的觀察與思考。
01
OpenAI與百度隔空對飆
OpenAI首席執行官Sam Altman,于2月13日凌晨公布了GPT-4.5和GPT-5的最新消息。免費版ChatGPT能在標準智能設置下無限制地使用GPT - 5進行對話。在更早之前的2月6日,OpenAI宣布ChatGPT Search向所有人開放,打開OpenAI官網即可直接使用,甚至不需要注冊。
另據CNBC報道,百度計劃在今年下半年發布下一代人工智能模型Ernie 5.0,將在模型多模態能力方面有重大增強。次日13日Open ai火速跟進,宣布即將發布GPT-5。
有意思的是,就在OpenAI公布ChatGPT Search全面開放的前幾個小時,谷歌宣布向所有人開放最新Gemini 2.0模型,包括Flash、Pro Experimental和Flash-Lite三個版本。
2月13日,文心一言在官網宣布將于4月1日0時起全面免費,所有PC端和App 端用戶均可體驗文心系列最新模型,以及超長文檔處理、專業檢索增強、高級AI繪畫、多語種對話等功能。
從以上幾家AI領軍企業的最新動向不難發現,大模型開放是大勢所趨,科技巨頭們都在主動開放各自的大模型產品,讓更多用戶體驗和使用。
02
更強大模型改寫AI競爭版圖
此次開放的大模型,綜合能力非常強悍。以文心一言為例,K哥作為文心一言的深度用戶,對于此前開放的文心大模型3.5版和這次全面開放的4.0版,還是比較熟悉的。文心大模型4.0較之前的版本,綜合能力更強大,K哥做了個測評。
先讓文心大模型預測下《哪吒2》最終全球票房,以下是3.5版的預測結果。
對比一下4.0的效果,不但給出了更具可能性的結果,整個思考鏈路非常清晰。
再來看看文生圖表現如何,我輸入提示詞:幫我畫一個奧黛麗赫本吃湯圓。以下是3.5版本出的圖,還是不錯的。
4.0版本基于iRAG技術,生成了更準確的人物臉部,而且一次可以生成多張供你選擇。
2月13日,文心一言還新上線了深度搜索功能,能針對專業咨詢類問題的解決能力進行全面加強,以解決專業問題查詢門檻高、查詢渠道專精、查詢結果分析難度大等使用挑戰。
在民生、創業、經濟分析等方面問題,能夠提供專家級的內容回復;除了搜索能力以外,具備更全面的思考、規劃、反思能力,針對工具規劃及調用能力上進行全面加強,能夠更加“聰明”的使用多個工具解決各類復雜任務問題。
接著說說大家關心的幻覺問題,RAG是主要的解決方案,百度在RAG技術上具備中文深度理解、多模態檢索、垂直領域定制化以及實時數據整合能力等優勢,在中文互聯網、企業服務、政務等場景中更具實用性和競爭力。從RAG能力實測來看,國內外主流大模型中,百度文心一言綜合表現最佳。
在解決圖片生成的幻覺問題上,百度提出了iRAG(image based RAG)技術解決方案,將百度搜索的億級圖片資源跟強大的基礎模型能力相結合,就可以生成各種超真實的圖片,去掉了AI味兒,而且成本很低。前文測評的案例中,大家已經感受到iRAG的強大了,iRAG具備無幻覺、超真實、沒成本、立等可取等特點,在影視作品、漫畫作品、連續畫本、海報制作等很多領域都有廣泛的應用空間。
在K哥看來,文心一言的全面開放,保證了用戶享有最佳體驗,進一步降低AI的使用門檻。在百度的頭部效應之下,會有越來越多AI公司加入開放的隊伍,這將有利于推動中國AI行業的發展,促進AI普惠。
03
大模型成本“三級跳”
杰弗里·摩爾在《跨越鴻溝》中指出,高科技產品在市場化過程中,會面臨一個難以逾越的“死亡之谷”,這是早期使用者到大眾用戶的過渡階段,能否“跨越裂谷”,是高科技產品發展的關鍵。2024年AI產品的用戶破圈增長,標志著AI已經“跨越裂谷”。
AI技術突破背后的成本降低,是這次大模型全面開放的核心原因。
一方面,大模型訓練成本大幅降低。以百度為例,文心大模型的訓練成本不斷降低,工程技術上的突破創新主要有3點:
1,昆侖芯性價比高,可降低單位算力成本。昆侖芯在性能上表現卓越,能夠在更少的計算資源下運行大規模模型(如DeepSeek-V3/R1),這使得大模型的推理和訓練所需的計算量減少,從而直接降低算力成本。
2,萬卡集群規模效應,提高資源利用率。百度智能云已點亮萬卡集群,并計劃擴展至 3萬卡。大規模集群可以通過任務并行調度、彈性算力管理等方式,提高計算資源利用率,避免算力閑置,提高單任務的計算效率,降低整體算力成本。
3,百舸平臺助力大規模集群實現高效的部署管理。如:超大規模HPN高性能網絡,將帶寬有效性提升到90%以上;創新性散熱方案,有效降低能耗,進一步優化成本;高效并行化任務切分策略,將MFU(GPU有效利用率指標)提升至58%;故障恢復時間為分鐘級,集群有效訓練率達到98%。
另一方面,推理成本的顯著下降。在飛槳深度學習框架的支持下,文心大模型通過優化實現推理性能提升,推理成本顯著降低。正如百度創始人李彥宏在阿聯酋迪拜出席“世界政府峰會”上所說的:“在過去,當我們談論摩爾定律時,每18個月,性能水平或價格都會減半。但是今天,當我們談論大型語言模型時,增加的成本基本上降低了,可以在12個月內降低90%以上。”
04
先進生產力人人可用
這場AI開放浪潮,預示著AI產業的全新范式:與其構建封閉的技術護城河,不如孕育創新的生態雨林。當大模型成為"水電煤"一樣的基礎設施,人類將會創造出遠超我們想象的數字文明。
一場屬于普通人的生產力革命正在悄悄降臨,正如馬文·明斯基所說的:"真正重要的不是機器能否思考,而是人類能否因之更好地思考。"此刻,屬于每個人的AI時代,才剛剛拉開帷幕。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.