春節前后,DeepSeek沖擊了全球各大媒體的頭版頭條。其高水準的表現和低廉的成本,讓不少媒體和從業者“懷疑人生”,人們不禁開始反思以Open AI為代表的“大力出奇跡”思路是否真的是AI發展的最優路徑。
窺一斑而知全豹,一些反應迅速又思慮深遠的外媒,也已經注意到了DeepSeek背后中國AI全面崛起的圖景。華爾街日報日前發布報道《It’s Not Just DeepSeek. A Guide to the Chinese AI Companies You Need to Know》,提醒美國人要注意哪些中國大模型公司。
文中主要將這些公司劃分為科技大廠和創業企業兩種類型,創業企業中DeepSeek和Stepfun等受到極大關注,科技大廠之中,阿里、百度則成為重點研究對象。華爾街日報著重指出,百度在中國最早推出面向公眾的生成式AI文心一言,如今這款產品已經擁有4.3億用戶。
全面崛起,百家爭鳴的中國大模型
中國AI并非是突然之間來到與美國并駕齊驅的高度的,DeepSeek的爆紅,更像是量變引起的一次質變,是整個中國AI產業的持續閃耀的過程中一次璀璨的迸發,這背后是無數廠商長期投入的結果。在Open AI聚集了全球目光的這幾年里,中國的大模型悄悄進入了一個百家爭鳴的階段。
深度求索成立于2023年,今年春節期間發布R1,讓DeepSeek迎來了第一個高光時刻。人們驚奇地發現,這家名不見經傳的東方小企業,做出了媲美Open AI最前端模型的產品,要知道,其對標的o1模型,即便是每月支付20美元的付費用戶,也只能限量使用,而DeepSeek則是完全免費的。
大廠方面,得益于充沛的技術基礎和資源調動能力,他們可以構建更加完備的基礎設施,或者將應用融入到既有的產品矩陣當中。比如快手團隊研發的可靈AI,在文生圖、圖生視頻的領域極具特色,特別支持對已生成的視頻進行一鍵續寫,這給用戶展現創意提供了張力。再比如豆包大模型,由同樣做短視頻起家的字節跳動研發,支持多模態信息交互,對提升社交體驗的各類功能提供了良好的支持。場景應用從移動時代開始就是中國科技企業的一大優勢,這在快手、字節的大模型研發上再一次得到印證。
更具有深刻代表性的是領航中國AI的百度。一方面,百度做了大量的底層技術創新,從算法、算力等多個層面上持續推動AI產業的成長,其“大模型技術”連續兩年獲得世界互聯網大會的領先科技獎,在中文處理方面實現了領先;另一方面,百度將這種能力開放給全社會,以AI開發者平臺為核心,讓AI能力向各個領域輻射和延伸。當然,還有一方面是百度自身研發的大模型得到越來越廣泛的應用。2023年初,文心一言緊隨Chat GPT上線,依托百度在搜索、云計算等領域的先天優勢,文心一言不斷更新優化,成為目前國內在技術積累、應用落地和開放性平臺方面都處于絕對優勢的大模型。
中國的AI產業從扎堆大模型到精耕應用場景再到多點開花的技術創新,在過去的數年里走出了一條與美國AI產業不盡相同的道路。直到DeepSeek的爆紅,這條道路終于被世人看到。從產品表現來看,中美兩國的AI能力比預想得要更接近一些。
外媒恐慌的源頭 意料之外的創新能力
DeepSeek此番在美國掀起的波瀾,堪稱空前。先有英偉達應聲跌去17%,后有美國國會要求白宮予以“特別關照”,再后來又衍生出大量的抹黑言論意圖為DeepSeek潑上臟水,甚至專業黑客也出馬攻擊DeepSeek的服務器。然而誰也逃不掉“口嫌體正直”的魔咒,就在昨天,微軟、亞馬遜、英偉達不約而同地選擇接入DeepSeek-R1模型。
日前,美聯社也發布報道《DeepSeek has rattled the AI industry. Here’s a quick look at other Chinese AI models》,文章稱即使在芯片的限制下,中國可能也已在AI競賽中超越美國,而DeepSeek還只是眾多中國公司之一,整個AI行業已經被中國“打亂節奏”。文章著重點名百度、字節跳動以及阿里巴巴,表達了西方對這些公司AI能力的憂慮。
美國對以DeepSeek為代表的中國AI產業之所以如此驚恐,主要有兩大原因,一是對信息安全是否受到威脅的顧忌,二是對優勢地位是否能延續的焦慮。在美國官方看來,技術先進,開源,低成本,哪一個都不可怕,但疊加在一起就堪稱“王炸”,如果美國企業和民眾紛紛選擇使用來自于中國的便宜好用的開源大模型,那將是對信息安全的一種重大沖擊;另一方面,低成本投入完成高水平產品,意味著中國企業的創新能力擊敗了,或者至少說,完全不遜色于巨額資金喂養出的美式企業,這意味遠期來看美國將不再對技術優勢地位有十足的把握。
換句話說,中國AI企業表現出了強大的創新能力,這種另辟蹊徑、后發先至所帶來的驚人成果,最容易讓領先者坐立不安。
DeepSeek以600萬美元對標美企數十億投資的故事大家已經耳熟能詳,我們以大廠再另舉一例。百度基于檢索的優勢創新性地推出了檢索增強生成技術,即RAG。通過結合信息檢索與文本生成模型,RAG大幅提高了生成內容的相關性和準確性,有效解決了傳統生成式模型經常“胡言亂語”的問題。對個人用戶來說,這極大程度地優化了問答體驗,避免了錯誤結論;而對于企業用戶來說,這一能力也讓智能客服、知識圖譜等服務的質量得以明顯提升。
借助春節期間的熱點,筆者對擁有RAG能力的文心一言,和Chat GPT的4o模型進行了多輪對比測試,力求全方位、深層次地剖析兩者的性能差異,探究它們在不同場景下的表現。測試中,文心一言對最新的春節檔電影細節、春晚節目等內容能準確回答,對某一節目獨特的創意構思、演員們的精彩幕后故事等,它也能對答如流,滿足用戶對最新資訊的了解需求。
反觀Chat GPT-4o,雖然它以全能性和多模態交互為主要特點,支持文本、音頻和圖像的輸入輸出,能實現跨模態的理解和生成,且具有快速響應時間和多語言處理能力,但在此次測試中,卻暴露出了一些短板。在面對需要兼顧信息檢索與信息生成的問題時,Chat GPT-4o往往顯得力不從心,難以準確地回答問題。下圖是兩者面對同一問題的直觀對比(上方為文心一言,下方為ChatGPT),結果差異十分明顯。
即便是“口碑”這種相對軟性的問題,文心也給出了符合事實情況的回答;ChatGPT則給出了完全錯誤的結論。
文心準確回答正在發生中的事實情況;ChatGPT則一本正經地轉移了話題。
對于更早期的歷史,文心一言給出了簡潔規范的準確答案;ChatGPT的回答不但結構松散,最關鍵的是信息出現巨大錯誤,獎牌榜第四名是俄羅斯,第五名是韓國。
此次對近期事件-與美國相關事件-遠期事件對比測試的結果表明,文心一言在信息檢索與生成的綜合能力上,尤其是在處理具有時效性和本土特色的話題時,展現出了超越Chat GPT-4o的優勢。這一發現不僅為廣大用戶在選擇使用人工智能模型時提供了重要的參考依據,也為人工智能領域的發展提供了新的思考方向,促使行業內不斷探索和創新,推動人工智能技術邁向更高的臺階。
中美并跑時代或能為AI創造更大紅利
從美國一家獨大,到中美并跑,這是一件值得恐慌的事情嗎?顯然不是,正相反,這種變化反而有可能會給AI產業帶來煥然一新的局面。眾所周知,良性的競爭、適當的壓力,更有利于產業的發展和進步。盡管一部分美國的媒體和AI從業者表現出了警惕和恐慌,但其實長遠來說,中國AI的崛起對整個AI產業是極大的利好。
日前,Meta創始人扎克伯格就稱贊DeepSeek在基礎設施優化上"新穎的進展",并認為Meta可以從DeepSeek的成就中受益,更早一些蘋果公司CEO庫克也認為DeepSeek推動了效率的創新,而這顯然是一件好事。
無論是DeepSeek在成本控制和代碼開源上帶來的沖擊,抑或是百度在專長領域帶來的底層技術創新,這些革新都不僅僅是讓企業自身受益,而是更整個行業帶來了更多發展契機。比如說,以前人們都無條件認可Open AI巨量算力、數據投入的發展模式,而自這個春節以后,人們就會思量一下,是否還有更優的選擇,這一方面開拓了思路,另一方面也減少了資源浪費。而百度在RAG、中文自然語言處理等領域的積累,顯然也可以對美國主流大模型優化生成結果提供重要的參考和借鑒。
Open AI計劃在2025年推出03模型,百度也將在這一年發布文心5.0,更多中美兩國的AI企業都在醞釀重大動作。2025年,中美你追我趕或許將成為AI領域的主旋律,這與以往的一枝獨秀格局不同,多元化的成長路徑,不同思路的碰撞與磨合,都必將會給整個產業帶來更多可能性。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.