大模型的創新,不僅僅需要單點的創新,更要圍繞AI-Native開展系統性地創新;不僅要在場景上廣泛探索,更要在技術上形成突圍。
重塑一切的理想主義AI
大模型已成為當下IT產業無可爭議的最大風口。
人工智能從概念提出至今已有半個多世紀,繼“深藍”和AlphaGo曇花一現之后,Transformer架構及ChatGPT的橫空出世,再一次點燃全世界的熱情,人工智能以更具象、接地氣的方式呈現,大模型和生成式AI也開始走入更多人的視野。
過去的一年來,從互動問答、語音對話到文生視頻,OpenAI屢次刷新熱度;Google、Meta入局推出開源大模型,圖謀一席之地;微軟將GPT4.0集成到辦公軟件中,成為生產力工具;華為和蘋果將手機語音助手接入大模型,加速端側智能化。
AI產業的拐點已經來到,大模型正在重塑一切辦公、生產和生活。
大模型火熱的背后,英偉達成為最大的受益方。隨著業界對AI算力的需求快速增長,GPU卡洛陽紙貴、一卡難求,其24/25Q1季報同比增長近4倍,達到260億美金。受持續提升的業績數據和不斷放大的市場需求支撐,2024年6月18日英偉達市值達到3.35萬億美金,連續超越微軟、蘋果,成為全球市值最大的公司。
一切都在向著人們期待的方向發展,甚至有人喊出了“第四次工業革命已來”。
盛名之下,其實難副
這波大模型浪潮并不如表面呈現的那樣光鮮亮麗,幾家歡喜幾家愁。
根據紅杉資本發布的報告,英偉達僅在2023年的芯片訂單就高達500億美元,賺得盆滿缽滿,而整個生成式AI企業的銷售收入才30億美元,多數企業距離盈利依然遙遙無期,甚至一些企業已經瀕臨破產的邊緣。
如果淘金者持續淘不到金子,賣鏟子的生意也終將不可持續。
不管是OpenAI、微軟還是谷歌,這些AI的先行者都還沒有找到穩定且持續的商業模式,更多的是為資本描繪了一副宏大的藍圖,以支撐市場的預期。
在國內,10億參數規模以上大模型數量已遠超100個。但還未形成成熟商業模式的大模型產業,已經開始卷起了價格,模型免費、Token降價、算力打折,多么熟悉的味道。在群雄混戰的早期通過低價圈定一波用戶和開發者無可厚非,適當的競爭有利于產業的良性發展,但無序的競爭將導致惡性循環,讓大模型產業陷入死亡螺旋。
2023年底,Gartner發布AI新興技術成熟度曲線,大模型和生成式AI正處在技術炒作周期的最高點,Gartner對生成式AI做出了極高的評價,認為它將AI的熱度推向了一個新高潮,但也表達了對繁榮之下所掩蓋的潛在風險的擔憂。
市場最終要回歸理性,只有真正為用戶創造價值才能實現商業閉環、有更長遠未來。
理想很豐滿,現實很骨感!大模型從趨勢到全面落地依然任重道遠。
化整為零,圍繞行業穿插作戰,實現戰略突圍
在這一波AI浪潮中,中國發展得怎么樣?當網絡上ChatGPT、Sora、英偉達的新聞鋪天蓋地襲來時,很多人不免產生焦慮:我們又落后了?
必須承認,我國在算力、算法和數據領域其實并不具備優勢:高端算力卡被英偉達卡脖子無法供應,短時間內自有制程和設計又無法跟上;算法領域,雖然模型數量眾多,但大多數是基于國外開源架構優化,缺乏自主性和領先性;數據領域,我們的開放數據和國外不在一個數量級上,中文語料嚴重不足。
AI的三要素,每一條都是致命傷!
但從另一個角度看,我國有全球唯一的全工業門類、最多的金融消費人群以及最大規模的政務和城市體系,產生了豐富的場景和私有數據,這些都成為發展行業大模型的天然土壤。于是,我們沒有走大兵團正面突擊的道路,而是化整為零圍繞行業穿插作戰,通過大模型賦能一個個行業細分場景,最終形成戰略突圍。
近兩年,在用戶和廠商的共同努力下,一些行業大模型已經開花結果。大模型已經逐步應用政務導辦、公文檢索、事件分撥等場景,幫助政府提升政務服務效率和城市管理效率;在礦山領域,大模型和云邊協同幫助礦山實現增安提效,加速產業集群智能化;在鐵路,基于視覺大模型的TFDS火車故障軌邊圖像檢測系統,實現不停車的實時圖像采集和分析,自動識別各種不同類型的鐵路貨車故障;基于大模型的氣象預測方案,計算速度相比傳統HPC的數值計算提升一萬倍,更精準預測臺風路徑。
還有醫藥、制造、鋼鐵、金融等更多行業的場景在持續落地,我們正在走一條和國外不一樣的務實之路,不跟風不冒進,沿著清晰的目標和節奏逐個打磨場景,這種涓涓細流,終將匯聚成智能化的汪洋大海。
行業大模型加速落地建議
行業大模型建設,知易行難。
政企業務場景復雜多樣,很難用通用大模型去應對。此時我們應該意識到,卷參數量、卷Token數、卷集群規模、卷價格都毫無意義,行業大模型落地更需要關注工程化的問題。
一、軟硬協同發展
除了模型本身外,大模型還涉及開發平臺、開發框架、計算架構以及各類工具,以及多樣性算力、高性能存儲和高帶寬網絡等硬件基礎設施。在分層解耦架構的基礎上,需要從性能、可靠性、可維護性以及兼容性等方面,進行端到端的集成設計和驗證。比如軟硬件全鏈路可視化運維、算網協同的低時延大帶寬網絡、基于親和性的算子加速等,確保系統不僅跑得好,更要跑得穩。
二、采用AI-Native的云基礎設施
AI-Native的云基礎設施正成為越來越多企業的優先選擇。基于公有云訓練基礎大模型,在本地私有云中結合私有數據通過二次訓練和微調,這種混合云方案兼顧效率與安全,已成為大模型建設的新范式,同時云邊協同的架構還可以有效簡化海量邊緣的管理,應對工業場景海量邊緣接入的需求。它相比非云的部署模式,還能提供對通用算力和AI算力的統一調度,并基于其豐富技術棧覆蓋數據、模型和應用開發全流程,降低開發門檻。
三、建立AI開發工作流,促進模型確定性交付
大模型是一個系統工程,其交付過程涉及數據管理、模型開發環境、模型訓練、推理部署的全流程數十個環節,傳統的開發機制很難解決跨團隊協作和迭代開發的難題。要降低模型開發過程的不確定性,需要建立一站式AI開發工作流,幫助企業快速構建跨團隊協同開發、高效迭代的機制,同時通過標準化、自動化的流程提高模型的交付效率與交付質量。
四、重視數據工程,打造優質數據集
模型性能是由數據質量和算法設計共同決定的,當前AI訓練數據缺乏系統化的治理工具,甚至部分工作需要人為處理,存在集成、清洗和標注效率低,以及價值觀的問題。打造高質量的AI大模型,必須構筑核心的數據工程能力,為大模型高質量供數。一方面可以借助開放的數據授權運營平臺,獲取高質量的數據;另一方面,針對內部數據需要引入自動化和智能化的手段,構建數據清洗、標注和質量評估體系;同時通過數據質量分析、成分分析、場景配比和智能配比能力,建立數據配比到模型效果的反饋優化機制,基于應用效果反饋持續調優,實現價值觀對齊。
五、建立賦能機制,繁榮產業生態
生態是發展大模型不可或缺的一環。需要從技術生態、數據生態、模型生態和應用生態四個層面,去構建AI時代開放、可閉環、有質量的生態體系。這個過程中,政府和行業頭部企業的作用不可忽視,可以帶頭建立如聯創實驗室、模型和應用商城、需求對接會、創新大賽等,并通過資金贊助、人才培養、政策扶持等多方面的牽引,通過行政手段打造中立的區域性賦能平臺;行業頭部企業在開展自身業務創新的同時,也可以通過技術、數據、模型和應用賦能行業和產業鏈上下游,從單企智能化走向行業智能化。
六、開展持續運營
大模型落地面臨缺經驗、缺人才、缺能力的挑戰,大多數企業都是邊實踐、邊總結。需要將這些經驗和能力固化下來,逐步形成覆蓋了大模型落地的全流程的工程能力,包括前期的頂層設計、POC測試、規劃實施,中期構建優質數據集、開展場景分析和模型開發,以及后期的運維運營等。大模型運營和建設同樣重要,缺少運營機制,大模型平臺很難持續發揮價值。因此,需要打造適合企業的流程、組織和人才隊伍,持續開展技術、生態、用戶運營,不會斷優化老場景、發掘新場景,最終實現全面智能化。
欲木之長者,必固其根本
大模型創新,歸根結底是技術之爭,根深才能葉茂。
大模型的創新,不僅僅需要單點的創新,更要圍繞AI-Native開展系統性地創新,不僅要在場景上廣泛探索,更要在技術上形成突圍。
近年來,國內涌現了一批代表性的科技企業,如寒武紀、地平線、壁仞科技、訊飛、摩爾線程、華為、阿里、百度等,他們堅持投入人工智能創新,推動AI產業升級。
2023年,百度 “文心一言”、阿里 “通義千問”和訊飛 “星火”陸續推出,華為也發布盤古大模型3.0,提出“AI for industries”的理念,并基于華為云Stack推出了業界首個大模型混合云。近期HDC2024上,華為云盤古大模型5.0升級亮相,打造全系列、多模態和強思維能力,進一步詮釋“解難題、做難事”的愿景,同時發布大模型混合云十大創新技術,通過AI-Native的系統性創新,加速企業專屬大模型落地。
創新者往往孤獨,但注定不凡。
不僅需要沉下心,更要有“板凳要坐十年冷”的戰略耐性。
我們終將迎來AI的黃金時代。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.