通用大模型、行業大模型
大模型概念層出不窮有何區別?
交通行業大模型如何構建?怎樣落地?
千方的角色是什么?優勢有哪些?
智慧交通ITS114專訪千方科技副總裁孫亞夫
請亞夫總為我們上了一堂大模型課
問
我們應該如何理解大語言模型,以及大語言模型在交通領域有哪些可能應用場景?
答
從哲學上講,人類基于概念理解世界,而大語言模型構建了理解世界的概念模型,因此具備了理解、分析、推理等能力,類似于一個接受過通識教育的大學生。
大語言模型的優勢在于其強大的自然語言處理能力,可實現更高效的人機交互、跨應用交互、跨系統交互。在交通領域,大語言模型具備發現問題、分析問題和解決問題的能力。
舉例來說,它可以協助開展交通運行狀況監測,如圖像和視頻分析、自然語言處理和語音識別等。可被訓練用于分析圖像和視頻,以檢測和識別車輛、人或其他交通運行特征,賦能交通管理部門實時監測和分析車輛、道路、信號燈等信息,智能協調交通流量,減少交通擁堵、降低交通安全隱患,讓交通更安全、更便捷、更智能。
問
交通領域對于大語言模型是否有強需求?大語言模型在現階段可以扮演哪些角色?
答
大語言模型與以往的人工智能不同,它具備了通用智能,可以說應用范圍近乎無限。凡是人們對專家需求強烈的地方,對人工智能亦然。
我們認為,現階段大語言模型的角色相當于AI助理,它能夠在原有業務系統、應用系統與客戶之間充當輔助者、支撐者,根據指令執行任務,如寫一篇稿件,生成一份分析報告。以交通運行協調中心TOCC場景為例,以往需要由技術人員操作系統,按需求生成分析報告,在應用大語言模型后,客戶便可以從系統中自動生成各類分析報告。
問
什么是行業大模型?如何訓練一個交通行業大模型?
答
我們可以把大模型分為兩類,一類是通用大模型,如ChatGPT,具備各個領域的基礎知識;另一類是基于通用大模型開發的行業大模型,如交通行業大模型,具備交通行業的深度知識、實踐經驗并經過驗證優化。
行業大模型的訓練,類似于將一個大學生培養為一位行業專家。對于交通行業大模型而言,首先,需要向大模型提供交通領域的專業知識。其次,將交通領域的案例、最佳實踐和專家經驗整理為訓練材料,讓模型不斷學習。與此同時,將模型帶入行業實踐不斷驗證,并針對問題持續給與指導、優化。
問
如何解決交通行業大模型訓練過程中的數據安全問題?您認為理想的訓練、迭代模式是怎樣的?
答
目前業內大多采用公有云部署進行訓練,并將數據保留在本地的方式,這種方式既解決了數據安全問題,又為大模型訓練提供了適當條件。當前行業大模型不會采用私有化部署,原因在于,其一,行業大模型部署需要較高的算力和成本,單個客戶私有化部署的投入產出比較低,多客戶共享服務可大大提升效益;其二,行業大模型處于持續演化的過程中,公有云部署便于客戶實時、快速的反饋和互動,有利于行業大模型的快速迭代。其三,隨著技術發展和行業大模型的成熟,通過對行業大模型進行微調,能夠訓練出特定場景的小模型,在算力需求減少且成本降低的情況下,可以考慮私有化部署。行業大模型的發展方向之一,就是私有化和小型化。
問
智能交通企業在交通行業大模型的應用進程中扮演什么角色?千方有哪些優勢?
答
智能交通企業是交通行業大模型的創造者和提供者,如前所述,行業大模型有賴于行業深度知識,因此行業大模型必定由行業內的企業創造。提供通用大模型的企業不可能獨自打造出交通行業大模型,而交通行業大模型也需要以通用大模型為基礎。
構建行業大模型,對于企業的綜合能力有很高要求,涉及行業理解、實踐經驗及技術能力等多方面。千方專注交通行業23年,業務場景覆蓋全面,行業知識積淀深厚,已有200多位行業專家,擁有成熟的方法論和豐富的實踐經驗。自2015年起積極布局人工智能領域,建立了國際領先的人工智能團隊,現已形成六類900余項全景AI算法,不斷推出算法產品與解決方案。在交通領域,我們攜手阿里云“通義千問”,共同推進大模型在行業內的應用落地。在AIoT領域,公司旗下宇視科技已推出行業大模型「梧桐」。
問
交通行業大模型的落地應用,面臨哪些挑戰?如何解決?
答
主要的挑戰包括如何以最高效率和最低成本,在通用大模型的持續迭代中進行行業大模型的迭代。其次,需要培養客戶對于交通行業大模型的理解和應用,以獲得更多反饋。以及如何平衡投入成本高,初期產出相對較低的問題。
在解決這些問題時,需要考慮交通行業大模型的應用階段。首先,數字化程度越高的行業,會越快產生行業大模型,而交通行業大模型的產出周期可能相對較長。其次,需要隨著市場的發展逐步迭代和落地應用,這是更切實可行的方法。
問
您對于交通行業大模型的應用路徑如何判斷?是否會曇花一現?還是會成為行業必需品?
答
未來,AI就像水、電一樣,是一個基礎能力,所有行業都會被重新AI化一次。我們認為,交通行業大模型的應用可以分為四個階段:
第一階段,我們以通用大模型作為提升效率的工具。交通行業的業務系統偏To G、To B,需要大量定制開發,客戶需求也是不斷變化的,開發周期長、交付效率低,利用大模型可在客戶前端快速編碼,實現快速交付。
第二階段,結合應用場景進行新產品開發。千方科技主要有兩類場景,一類與視覺感知有關,另一類是交通場景,包含交通信號優化、調度場景、交通運輸查違章等。原有的視覺AI模型缺乏對世界的理解,結合通用大模型后,可以快速根據場景進行落地應用。
第三階段,在通用大模型基礎上,結合行業知識與專家經驗,形成交通行業大模型。這方面我們在做一些嘗試,具體應用取決于行業、市場對它的理解,以及客戶的接受程度,需要一個過程。它的滲透不會像消費市場那么快,但門檻非常高,一旦建立很難被跨越。
第四階段,結合千方科技的前端感知設備、邊側智能設備和云端的行業大模型,我們有可能會把交通系統變成一個半無人或者由人監督的自動化運行系統,這是我們未來研發的目標。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.