歲末年初,大模型市場也迎來了一波整理與復盤。如火如荼的人工智能大模型熱潮經過一年多的發展,終于有所降溫。以ChatGPT為代表的大模型先驅身上的光環開始不再耀眼,DeepSeek的橫空出世甚至改變了整個行業狂卷算力的慣性,讓更多人懷疑之前的通用大模型道路是不是方向錯了。
這一切的格局變化都意味著火爆的千模大戰已經終結,大模型的發展方向之爭開始逐漸顯現出全新答案。
回歸理性,跟風的逐漸散去
大模型熱潮在ChatGPT橫空出世后席卷全球,國內也憑借ChatGPT之前的開源代碼開啟了一場“千模大戰”。不過時間是最好的退燒藥,經歷了一年多的發展之后,不僅千模大戰沒有產生什么值得肯定的結果,就連ChatGPT本身的發展也陷入了瓶頸,行業渴望的奇點突破遲遲未能出現,而通用大模型的實用性尤其是商業價值則一直沒有得到很好的體現。
隨著卷算力的成本越來越高,國內獲得算力卡的難度也越來越高,千模大戰偃旗息鼓也就不足為奇了。最近大熱的DeepSeek被稱為“AI界拼多多”,因為走出了一條完全不同的低算力需求道路而備受關注,也說明了整個行業的方向彷徨,行業主流也在懷疑過去狂燒算力的道路對不對。
這種彷徨的情緒自然也傳到了國內,往下走肯定還是追不上ChatGPT,另辟蹊徑則尾大不掉,很難重頭再來。整個行業又重新回到了開源更好還是閉源更好,大模型更對還是小模型更佳的基礎分歧上了。
不過,行業的資深玩家卻似乎沒有那么多猶疑和顧慮,根據自身和優勢堅持各自的選擇,也摘得各自的果實。比如說,一開始就選擇走場景應用之路的訊飛星火大模型漸入佳境,在解決了諸多場景應用的難題之后,還在持續進步和迭代。
12月底至今,科大訊飛有三件大事:
12月30日,訊飛醫療科技股份有限公司在香港聯交所主板成功掛牌上市,成為醫療大模型第一股;1月初,三方數據統計2024年大模型市場情況,科大訊飛的中標數量和中標金額都位居第一;1月15日,科大訊飛召開了訊飛星火升級發布會,推出了星火深度推理模型X1、星火語音同傳大模型,并率先將深度推理類模型應用到教育、醫療等真實場景。
這不僅讓科大訊飛成為了整個人工智能行業非常值得探討的案例,也給行業帶來很多問題去思考,人工智能乃至大模型的意義究竟是什么?中國的人工智能和大模型企業如何能夠更快用技術實現價值?隨著中國的大模型競爭逐漸理性,跟風的隨風消逝,這些問題的答案似乎不言自明。
“國產化”突圍,適合的就是最好的
也是近日,國際咨詢機構弗若斯特沙利文發布《2024年中國大模型行業應用優秀案例白皮書》。報告顯示,2024 年大模型在中國的產業落地明顯加快,中國AI大模型市場規模已從2023年的105億元增長至2024年的165億元,同比增長57%,預計到2028年市場規模將達到624億元,復合增長率為40%。
各廠家逐漸摘得第一批果實。第三方數據顯示:在2024年,無論是大模型招投標的全年總盤還是在央國企領域,科大訊飛的中標數量(91個中標項目)和中標金額(84780.8萬元)均居第一,超過了第二名到第六名的中標金額之和,成為2024年度大模型中標項目的“標王”。
中石油、中國移動、中國海油、交通銀行、中國人保等頭部央國企都選擇與科大訊飛合作共建大模型,科大訊飛已經逐漸在央國企領域樹立了自己的競爭優勢,獲得了國內核心行業領導企業的認可,呈現出一種風景這邊獨好的景象。
“贏得市場”是多重因素的結果,其中不得不提的是科大訊飛一直堅持并獨具優勢的“國產化”。董事長劉慶峰不止在一個場合說:要把創新發展的主動權掌握在自己手上,就絕不能在別人的院子里建高樓。
大模型研發開始的2023年10月24日,科大訊飛就攜手華為打造了首個支撐萬億參數大模型訓練的萬卡國產算力平臺“飛星一號”;一年后的10月24日,又聯合華為、合肥市大數據資產運營有限公司宣布“飛星二號”正式啟動。
全國產化算力之上,科大訊飛的成績有目共睹,訊飛星火底座大模型幾乎以每兩個月一次的速度進行迭代。完全的自主知識產權,不僅保證了數據的安全性,也保證了未來發展的可持續性。
當然,這份遠見卓識要在技術研發實力之上。2020-2023年,科大訊飛累計研發投入125億,每年平均下來有29億元。2024年前三季度,科大訊飛研發費用總計達30.371億。
在今天的訊飛星火升級發布會上,科大訊飛又發布了我國首個基于全國產算力訓練的具備深度思考和推理能力的大模型——訊飛星火X1。“盡管在全國產算力平臺上訓練深度推理模型遭遇了諸多挑戰,但科大訊飛攜手華為成功攻克了訓練推理強交互、高吞吐推理優化以及國產算子優化等一系列難題,最終成功訓練出訊飛星火X1。”科大訊飛相關研究負責人說。訊飛星火X1已經在教育、醫療等領域應用。
與此同時,訊飛星火4.0 Turbo也迎來了一波重大升級,七大核心能力的提升都有了更大提升。
應用“導向”,大模型更要“懂行業”
大模型可以學習全人類的知識,但最終應用在某個行業、企業中,最重要的是成為“行業專家”,這是應用落地最有用、高效的途徑。
所以,科大訊飛做行業企業落地,秉承的原則是“通專結合、端云聯動、軟硬一體”,給客戶、用戶提供各種方案組合,豐儉由人。
我們看到,科大訊飛已經和央國企及20多個行業的頭部企業一起發布了覆蓋300多個應用場景的眾多行業大模型產品,也開發了星火智能體平臺、星火飛碼iFlyCode、星火智能評標等多項工具,讓企業能以零代碼、低代碼的方式完成場景應用開發,定制專屬大模型助理。
在技術研發和落地的過程中,科大訊飛十分看重的“漣漪效應”起了作用——這是指在技術應用過程中,使用者越來越多,數據和反饋也會變多,系統誤差在大量數據的修正中變得越來越小。
1月15日,訊飛星火底座大模型的升級也充分體現了“應用導向”。圍繞行業、企業的痛點問題,訊飛星火在數學能力、行業知識、圖文識別、長文本能力等能力上實現提升。
以圖文識別能力為例,在實際工作中,經常面臨圖文識別的“疑難雜癥”:如醫療的體檢報告、法院的文書、學術論文、企業合同等,還有復雜長表格、雜亂板式、手寫公式、印章手寫合同、傾斜少線等情況,訊飛星火4.0 Turbo圖文識別能力升級,通用文檔版面分析、文字識別的準確率相對提升了40%,復雜表格結構、潦草手寫文字等方面的準確率相對提升了60%,大幅提升高價值數據的獲取能力。
再說長文本能力,企業知識問答這類嚴謹的應用場景中,用戶對大模型幻覺的容忍度幾乎為零。訊飛星火推出了基于智能體的全新長文本框架,行業首發了句子級溯源功能,使得知識回復的錯誤率降低了40%,句子級溯源效果更是超越了GPT-4o。
考慮到不少用戶在寫報告、做調研這類工作時,往往需要花費大量時間搜集信息、整理資料,基于圖文、長文本能力的提升和行業應用能力的積累,訊飛星火行業首發了混域知識搜索技術,能實現對個人知識、企業知識、業務系統數據、精品行業數據以及互聯網信息的綜合搜索,只需一次提問,即可獲得綜合搜索后的結果。
技術升級帶動了各場景服務能力的升級,金融、油氣、能源、電力、鋼鐵、航司等行業能力提升都超過10%。
針對當前熱鬧的出海熱、頻繁的國際交流需要,科大訊飛又發布了國內首個具有端到端語音同傳能力的星火語音同傳大模型,把翻譯能力和效果提升到了一個全新的高度。
可以看出,科大訊飛首先用大模型改造了升級了自己強勢領域,并拿到了成功應用的結果,然后又用這些成功的經驗去為其他行業賦能,這無疑是給行業做出了一個優質的示范。訊飛星火大模型已經成為了新質生產力的核心代表,成為了國家核心行業和企業智能大模型發展的基石。所以大模型的正確方向不是成為人而是幫助人。
相信隨著更多行業產業企業的大模型應用落地,科大訊飛在人工智能領域的優勢還將繼續加大,對整個社會效率的推動和提升也將進入一個全新的高度。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.