人工智能,在過去十余年的發展中不斷創造著驚喜和奇跡。
基于深度學習的人工智能產業經歷著從小模型到大模型、從文本生成到多模態,從專用到通用的發展歷程,正逐步進入大模型時代。在“大模型+大數據+大算力”加持之下,Open AI公司先后發布的生成式AI模型chatGPT3.5和4.0在多場景、跨學科和多用途的任務處理能力表現驚艷。
現在,大模型常常被比作AI時代的操作系統,可賦能千行百業、推動經濟發展。同時,作為智能領先科技,大模型更符合新質生產力的要求,成為科技領域最熱門賽道。國外,谷歌微軟臉書一眾名企紛紛大手筆投資大模型,在國內,BAT、華為小米重金投入大模型的企業不在少數,文心一言、通義千問、訊飛星火一大波大模型如雨后春筍迅速崛起。
3月,黃仁勛在英偉達GTC2024大會上展示最新生成式AI的計算平臺和產品。同時,也展示了人工智能和大模型在各行各業的應用,在數據處理、工程模擬、電子設計自動化、計算機輔助藥物設計、量子計算和生成式 AI 等領域實現突破。
值得一提的是智能駕駛和配送領域,英偉達宣布全球交通運輸的領先企業已采用 NVIDIA DRIVE Thor?集中式車載計算平臺,助力自動駕駛和無人配送;借助數字孿生技術,在大型倉庫和廠房空間實現更高效規劃和設計。顯然,用大模型提升貨運系統效率提升,也將成為大模型的重要落地場景。
【人工智能大模型的誤區】
不過,作為人工智能領域長期的觀察者,我也發現大模型發展中存在不少誤區。
一個是唯硬件論。在大模型領域有句名言“大力出奇跡”,大力就是超大規模的硬件算力投入,奇跡則是AI能力。大力出奇跡,一直被OpenAI等大企業奉為圭臬。而他們則通過大量購置、提前囤積先進的GPU提升數據訓練速度,希望用硬件投入的差距,成為阻擋后來者的護城河。
另一個是片面追求超大模型和通用模型,場景落地能力差。
很多大模型的通用能力很優秀,但在垂直領域、細分場景的數據集明顯不足,常出現特定場景的表現不佳的情形。在細分行業,通用語言大模型更像是個半成品。他們能夠完美理解文本、圖片甚至聲音視頻,但很難深入理解某個細分領域。這樣的大模型可能是語言專家,卻常常不是行業和問題解決專家。
比如面對復雜的貨運行業,傳統大模型開發就面臨諸多難點:
一個,貨運業務紛繁復雜。貨運物品體積、重量往往大小不一,車型五花八門;貨運場景環節眾多,司機從接單到裝貨、運貨、卸貨,用戶下單溝通再到收貨付款,整個貨運鏈條相當繁雜;需求復雜,不同用戶對于貨物類型、運輸時間、距離、成本需求大相徑庭。普通的大模型很難理解如此復雜貨運體系,很容易造成判斷偏差。
數據是大模型的原料,而貨運領域數據的復雜度,很多大模型難以消化。
貨運業務涵蓋了訂單、貨物、車輛、駕駛員、路線等多個方面的數據。這些數據不僅數量龐大,種類多樣。貨運業務中的數據處于動態變化中。貨物的狀態、位置、運輸進度等都在實時變化,這也需要貨運大模型能夠實時捕捉和處理這些動態數據,并做出準確的預測和決策。
早在這之前京東就發布了“京東物流超腦”,菜鳥供應鏈也推出了“天機π”,而貨拉拉今年3月份首次公開的貨運無憂大模型,為大模型在物流場景落地,提供了一個嶄新思路。
【貨運行業大模型的解決之道 】
單從企業名稱上看,貨拉拉是個不折不扣的貨運企業;但從核心競爭力上,貨拉拉早已深耕技術多年。早期的貨拉拉利用移動互聯網和大數據,減少了貨主與車型、司機之間的信息差,大大提升了車貨匹配效率和物流效率,改變了傳統小、散、亂、差的貨運行業。這時可以看成貨拉拉的數質化1.0版。
2020年是貨拉拉數質升級的關鍵時間點,這一年貨拉拉上線“智慧大腦”的中臺系統。在AI、大數據和地圖等基礎能力之上,通過自研運籌優化算法框架解決核心的資源優化配置問題,多個引擎,實現動態定價、智能分單、運力調度、用戶拉新的效率提升,逐步解決物流生產要素中“人、車、貨、路”的數智化問題。這是貨拉拉數質化2.0版。
貨拉拉“智慧大腦”表現不俗。在拉貨、搬家場景中,貨拉拉的智能分單系統日均可處理上百萬訂單與國內平臺超過90萬名月活司機之間的即時分配問題。借助“智慧大腦”,貨拉拉將平臺訂單的司機準點率達到了95%,貨運需求配對率達到92%,實現社會物流效率最大化。
而基于智慧大腦的AI、大數據等技術研發的貨運無憂大模型,就是貨拉拉數質化3.0版。
在貨拉拉看來,AI的競爭并非一場比誰能把模型做得更“大”的軍備賽,貨運作為強垂直行業,更適合走輕量化、場景化的部署路線。與行業盲目求大的玩法不同,貨拉拉無憂大模型研發理念是:輕量化、場景化。
貨拉拉大模型,主要針對傳統模型在處理復雜數據和細節時表現不佳,預測結果存在較大偏差的痛點。貨運無憂大模型通過構建更加復雜的模型結構,可針對復雜數據提升預測精度,還具備更強的泛化能力和適應性。通過在大量多樣化數據上的訓練,可以適應更多種類的任務和數據。
現在,貨運無憂大模型已經在多個場景落地,比如AI邀約、 AI客服、審核判責、AI招聘、多模態AI助手。借助AI助手,在用戶側,可幫助用戶根據貨物智能匹配車型;在司機側,上線了違禁品識別功能,甚至能實時識別出違禁物品。
據了解,貨運無憂大模型針對貨運事實性問答準確率達90%以上,在貨拉拉業務知識、多種貨運知識多維度能力評測中均達到業界領先水平。
貨拉拉的大模型還衍生出豐富的能力矩陣,長期來看,能夠實現顛覆式降本增效的作用。在客服/邀約場景中,貨拉拉已經打造了基于任務型對話的AI機器人,實現全鏈路自動閉環;在辦公場景中,貨拉拉打造HR智能問答助手,應用AI智能招聘,成本降低近90%。
【貨運無憂大模型能否成為撐起貨運領域的AI一極】
在貨運物流行業,大模型的應用并不止貨拉拉一家,比如京東在物流產業側的大模型“京東物流超腦”、菜鳥發布的大模型“天機π”,面對這些不差錢、不差硬件的同行們,貨運無憂大模型能否成為撐起貨運領域的AI一極?我想,答案是肯定的。
首先,貨運無憂大模型的先發和區域優勢。
時間維度上,貨拉拉在數字化、智能化的技術方面積累已久,早在2020年便已搭建“智慧大腦”中臺系統。
其次,大模型的目標不同,貨拉拉的目的在貨運,電商企業在電商。
貨拉拉的貨運無憂大模型目標在于提升貨運效率,助力貨運行業實現“三化”,即:數智化、集約化、精細化。數智化,提高物流運作的效率和準確性。集約化,實現資源的優化配置,避免資源的浪費和重復投入。精細化:精細化更注重對貨運過程的細節管理和服務質量的提升,實現更高的服務質量和效率。
京東和菜鳥的快遞物流業務只是零售業務的一個環節,最終還是為零售業務服務。
比如菜鳥借助大模型,提升倉儲系統的數字化,全鏈條信息化,再到數字孿生技術之于供應鏈體系的革新,目的在于提升零售業務的效率。而京東物流超腦,早期應用人臉識別,提高賬戶和支付的安全性的同時提高用戶體驗。至于生成式大模型,京東更側重于生成數字人。比如,最近大模型生成的數字人“劉強東”上線,其目的是幫助京東迅速切入電商直播業務。
最后,也是最重要因素是大數據差異化優勢。
大模型需要算法、算力和大數據的綜合實力。算法是技術積累,需要堆人力;算力靠的是硬件,需要堆顯卡GPU;而大數據靠的是長期的業務積累。巧婦難為無米之炊,算法和算力是錢能買到的要素,而數據,尤其是貨運行業多年的復雜數據,則形成了難以跨越的護城河。
京東和菜鳥的大數據來自零售業、供應鏈甚至制造環節,而貨拉拉的業務并不局限在零售和生產,還包括服務業,比如搬家、零擔等等。京東和阿里的數據關注點在商品,連接的是商品與用戶;而貨拉拉的核心是貨運服務,連接的是司機和商品。貨拉拉的業務模型更像滴滴,只是貨拉拉的重點在拉貨,滴滴的重點在于拉人。
在大模型落地貨運的場景中,堆硬件并不能大力出奇跡。相反,對于那些多年專注貨運數字化和信息化的企業,在積累了多年的貨運數據和大量算法的貨拉拉,反而憑借大數據獲得差異化優勢,成為貨運大模型場景三足鼎立中的實力玩家。
【結束語】
如何讓大模型場景落地,我的前老板周鴻祎在哈佛論壇演講中,有的觀點相當精辟:
用戶要的并不是大模型,而是用大模型解決了什么問題。用戶要的不是鉆頭,是鉆頭鉆出來的洞;先做大模型再去找場景的玩法是不對的,大模型創業,最重要的是找到場景,然后根據場景定義功能,再根據功能來訓練專業的模型。
英偉達2024GTC大會上印證了老周的觀點。大會展示的大模型應用并不只有通用生成式大模型,在垂直領域,如企業智能助手、自動駕駛、機器人、數字孿生、數字地球2.0、以及大模型在醫療、制藥、工業設計等多個領域都有成功的項目,大模型落地垂直的場景更令人期待。
在人工智能領域,中國并不缺實力玩家,幾十家的通用大模型方興未艾就是證明。但我相信,在大模型落地垂直領域時,同樣會涌現了一批實力玩家,長期專注貨運領域的貨拉拉會和菜鳥、京東一樣,成為貨運大模型領域的實力玩家。
雄觀,資深新經濟觀察家、知名意見領袖,國內首個嚴肅科技脫口秀“雄辯”主講人、十大科技自媒體(見各大權威榜單)。曾在阿里巴巴、360、搜狗、藍港等著名互聯網公司負責相關營銷工作,參與5次IPO,橫跨行業主要領域。每日一篇深度文章+科技熱點快評,發布于微信、微博、頭條、百度,各大門戶及科技博客、媒體社群、短視頻等30+全部主流平臺,覆蓋400萬中國最核心商業、科技人群。為FT金融時報、福布斯等世界級媒體撰稿人,觀點被媒體廣泛轉載引用,影響力極大。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.