作 者 | 百融云創研究院
來 源 | 九卦金融圈
一、AGI的9年之約
最近的紅衫資本AI峰會廣受關注,會上OpenAI研究員丹·羅伯茨 (Dan Roberts)為了更直觀地展示當前模型的推理水平,設計了一個巧妙的思想實驗:讓1907年(廣義相對論提出前)的阿爾伯特·愛因斯坦嘗試解答一道關于廣義相對論的期末考試題。
結果顯示,O3模型已經能夠在一分鐘內解決復雜的教科書級物理計算。而愛因斯坦本人,則需要大約8年的時間才能“發現這個問題”。愛因斯坦的思想實驗可以作為衡量當前AI推理能力的標尺。
紅杉資本的合伙人康斯坦丁提到“人工智能可以完成的任務長度每7個月翻一番,呈指數增長”。基于此,丹進行了一個大膽的推斷:從當前模型能處理約1小時任務的水平,到達到愛因斯坦思考廣義相對論所需的8年時間(大約需要16個翻倍周期),這意味著“在9年內,人類將擁有一個能夠發現廣義相對論的模型。”
雖然人類去預測AI的發展從來沒準確過,但業內認為AGI面臨前所未有的可能,因為關鍵的要素條件已經具備:計算能力、網絡、數據、分發渠道、人才等。
二、AI微笑曲線的演化:
從技術主導到場景驅動
主要趨勢為:
技術輕量級:模型壓縮、邊緣計算、MoE架構等技術突破,使千億參數模型可部署至普通服務器
場景深化:通用大模型向垂直領域滲透,通過全量微調、RAG檢索增強等注入行業知識,形成“開發-場景化-營銷”新曲線
我們從今年第一季度大模型中標項目分布也可以看出,算力類項目披露金額為160565萬元,金額占比65.1%,應用類項披露金額為61540.8萬元,占比為24.9%,兩者合計占大模型產業價值的90%。
“智能體經濟”成資本新寵兒。紅衫資本的合伙人康斯坦丁說,“智能體不僅僅交流信息的經濟形態。它們轉移資源,可以進行交易,跟蹤彼此,理解信任和可靠性,并且它們實際上擁有自己的經濟體系。”康斯坦丁強調,這個經濟體系“并沒有排除人類,它完全是為了人類”,是一個人與代理深度協作的新生態。全球客戶的關注點從“能用的工具”轉向“能寫入利潤表的實際結果。
另外AI和大模型已經被普遍接受,逐步形成用戶行為的演變:AI從嘗鮮到依賴,融入日常工作流。越來越多的行業,越來越多的人正在從人工智能中獲得價值。
三、銀行的AI場景深化難度不在技術
AI場景深化往往面臨從概念到機制到監管各維度的問題,障礙很多,但障礙中唯獨沒有技術。
概念:基礎大模型如何為我所用?大模型和大模型平臺有啥關系?
財務測算:我為AI花的錢,怎么賺回來,如何衡量AI產品的ROI?
崗位人才:場景建設與測試本身也是強化學習一部分,不是簡單工作流可以實現,誰來做這件事? 業務人員還是科技人員,如何形成合力?
監管:監管是否進入AI時代?大模型的應用是否有容錯機制?誰能保證大模型不出幻覺?
針對上述問題,我們有一些觀點供參考:
1、只有基礎大模型難以滿足場景化需求
我們可以看下面這張圖,大模型應用場景Agent建設需要精密的工程化集成。紅字部分是大模型,但是只占整個建構非常小的一部分。除了大模型,還需要各類專家模型的輔助,才能提高智能體響應的準確程度。
表:各類專家模型輔助大模型
圖:Agent建設需要精密工程化集成
2、沒有一個模型適用于所有場景
Agentic AI 如DeepSeek:
優勢:推理和規劃能力強,擅長代碼生成、數學計算、結構化思考、長文寫作
不足:耗時長、原有prompt無法復用、長Prompt容易被干擾
適用場景:代碼助手、策劃/寫作、規劃/推理、數據合成/標注等
Conversational AI
優勢:響應快、對話方式自然、任務的覆蓋豐富度更高、對RAG任務的支持更好
不足:推理能力不足、計算和邏輯不可靠
適用場景:對客溝通、基于知識庫的問答
我們比較了各類模型在國內外知名金融考試中的表現,DeepSeek在準確度上表現最優。
但是在智能語音交互場景,DeepSeek由于高延時和非口語交互風格,表現比百融主動營銷大模型BR-LLM-ProActive遜色很多。
注:500個營銷對話生成記錄由業務人員按照回復效果進行打分, 0分代表答案不好;1分代表答案普通;2分代表答案優秀。
3、投入產出比,換個角度去思考
在評估 AI 價值的過程中,若單純以工具思維考量,投入產出的測算往往充滿復雜性與不確定性。工具思維下,AI 常被視作一種輔助手段,其價值融入整體業務流程,難以精準剝離與量化。例如在一些傳統制造業引入AI 進行生產流程優化時,很難確切分辨最終效益提升中,多少是 AI 帶來的直接貢獻,多少是其他環節改進的結果。
然而,將 AI Agent 視為數字員工,為價值創造評估開辟了新視角,使其變得更具可衡量性。
以營銷或催收這類垂直業務場景為例,從成本維度深入剖析,百融云創所提供的 AI 坐席,成本不到人工坐席的 10%。在營銷場景中,人工坐席每天需投入大量時間篩選潛在客戶,而 AI 坐席能夠憑借高效算法,瞬間完成海量客戶數據篩選,精準定位高意向客戶,大大節省了時間成本。
從產能層面來看,AI 坐席產能出眾,能夠達到人工銷冠產能的 80%。在催收場景中,AI 坐席可依據欠款客戶還款歷史、消費習慣等多維度數據,制定個性化催收策略,在合規框架內高頻次、高效率觸達客戶,其每月成功催收款項金額接近人工銷冠水平,甚至在某些月份,超越人工坐席平均產能。
這不僅體現了 AI Agent 在特定業務場景中的高效能,更直觀呈現出清晰可辨的價值創造能力,讓企業在評估 AI 投入時,能夠依據成本與產能的直觀數據對比,做出更具針對性與科學性的決策 。
結語:
銀行要實現智能化,實現大模型的深度場景化,其實功夫在詩外,其順序應該是文化 - 人才 - 流程 - 數據 - 智能。
文化是銀行智能化轉型的基石,它塑造著銀行的價值觀與行事風格,深刻影響著轉型的方向與成效。一個鼓勵創新、勇于嘗試的銀行文化,能夠讓員工積極接納新觀念、新技術,為智能化轉型營造良好氛圍。反之,若銀行文化保守、抗拒改變,即便引入先進技術,也難以充分發揮其價值。
人才是推動銀行智能化轉型的核心動力。大模型的深度場景化需要多領域專業人才協同合作,既要有深諳金融業務的專家,又要有精通人工智能技術的工程師,還要有能夠將業務與技術緊密結合的復合型人才。
流程的優化是銀行智能化轉型的關鍵環節。傳統銀行的業務流程往往繁瑣復雜,存在諸多手工操作與重復勞動,這嚴重制約了智能化技術的應用效能。通過對業務流程的梳理與再造,利用智能科技簡化操作環節、提升處理效率,能夠為大模型的深度場景化提供有力支撐。
數據是銀行智能化的 “燃料”。優質、豐富的數據是大模型發揮作用的基礎。銀行需要建立完善的數據管理體系,對海量的客戶信息、交易記錄等數據進行收集、整合與分析。只有數據質量高、覆蓋范圍廣,大模型才能學習到更準確、全面的知識,從而在風險防控、客戶服務、產品創新等場景中提供更具價值的服務。
當文化、人才、流程、數據等基礎工作扎實推進后,智能的實現將水到渠成。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.