99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

大語言模型上車應用-車載智腦

0
分享至


本文約5,000字,建議收藏閱讀

作者| 直觀解

出品| 汽車電子與軟件

#01

佐羅與馬—大語言模型在汽車行業的最大用途是自然語言控車

大語言模型在汽車行業的最大用途(如果不是之一的話)是讓人類像控制馬一樣控制車輛。讓車輛變成能聽懂人話的靈性智能體。

人類和動物的感官是定性的,人類的思維方式是啟發式的(也就是總結道理應用道理),因此人類的語言輸出從根本上講是定性而非定量的。

可以說在所有動物中,發展出定量思維的只有人類,但日常生活中最頂尖的定量思維者在90%以上的場景中也是依靠定性語言表達和周遭交互的。


圖 1 佐羅通過自然語言和有靈性的馬互動(圖片來自電影劇照)

佐羅召喚他的“黑旋風”“(馬名)時,絕對不會說要求黑旋風先跑到A坐標點,速度12公里每小時;再從A跑到B坐標點,速度8公里每小時;最后停在B坐標點停留5秒,好讓佐羅跳上馬背,并且要提前放松馬腿的“懸掛系統”,以緩解一個成年男性從兩米高落下的沖擊力。

如果這樣說話,話還未說完,佐羅已經命喪敵手了。

幸運的是,馬作為一種聰明的動物能聽懂和理解主人的一部分的定性指令,并且自己決定具體行動方案。

今天的chatGPT,規模可以高達1750 billion個浮點數參數,完全可以勝任一匹智慧馬或者一輛智慧車的能力。

用chatgpt把人類的定性語言,無論是語音識別輸入還是轉換為定量的計算機參數,來控車。通俗說就是讓車聽懂人話,然后車進行定量的動態調整,人只給出定性的方向,車自己計算定量的量并執行。

#02

大語言模型發展史就是計算機理解定性語言的發展史

大規模語言模型(Large Language Models, LLMs)的發展表

年份

模型名稱

描述

1966

ELIZA

最早的自然語言處理程序之一,通過簡單的模式匹配來模擬人類對話。

1972

PDP-10版本的ELIZA

進一步改進了對話能力。

20世紀參數圖片)初

Markov模型

雖然不是專門為語言設計,但為后來的語言模型提供了理論基礎。

1980年代

隱馬爾可夫模型 (HMM)

用于語音識別和自然語言處理,如自動分詞和詞性標注。

2000年代

神經網絡語言模型

隨著深度學習的興起,神經網絡開始用于語言模型,如Bengio等人在2001年提出的模型。

2000年代

RNN語言模型

循環神經網絡(RNN)用于處理序列數據,如文本。

1997

LSTM

長短期記憶網絡(LSTM),一種特殊的RNN,能夠更好地捕捉長期依賴關系。

2013

Word2Vec

通過淺層神經網絡將詞匯映射到向量空間,極大地推動了自然語言處理的進步。

2014

GloVe

另一種詞嵌入方法,通過全局詞頻統計來訓練詞向量。

2017

Transformer

基于注意力機制的模型架構,極大地提升了自然語言處理的效果。

2018

BERT

通過預訓練和微調的方法在各種NLP任務上取得了突破性的成果。

2018

GPT-1

生成式預訓練模型,展示了強大的文本生成能力。

2019

GPT-2

增加了模型規模,提升了性能。

2020

GPT-3

擁有超過1750億參數,成為當時最大的語言模型。

2022

InstructGPT

通過人類反饋強化學習(RLHF)進行微調,提高了指令跟隨能力。

2022

ChatGPT

基于InstructGPT的聊天機器人版本,能夠更流暢地與用戶互動。

2024

GPT-4

最新版本,進一步增強了模型的能力。

2019

T5

文本到文本的Transformer模型,可以應用于多種NLP任務。

2019

RoBERTa

改進了BERT的訓練方法,提高了性能。

2021

DALL-E

結合了文本和圖像生成的能力,展示了跨模態理解的潛力。

2025

DeepSeek

中國深度求索(DeepSeek Inc.)自主研發的通用大語言模型體系,涵蓋從7B到超千億參數的完整模型矩陣。

大語言模型的發展大多(如果不是全部的話)圍繞對下一個詞的預測概率展開,這通常被稱為“自回歸”模型。這些模型通過學習大量文本數據中的模式和規律,從而能夠預測給定上下文下的下一個詞的概率分布。

自回歸模型

1. ELIZA (1966):

雖然不是嚴格意義上的語言模型,但ELIZA通過簡單的模式匹配和模板填充來生成回復,其工作原理類似于早期的自回歸模型。

2. PDP-10版本的ELIZA (1972):

進一步改進了對話能力,通過更復雜的模式匹配和模板替換來生成更自然的回復。

3. Markov模型 (20世紀初):

雖然不是專門針對語言設計,但一階和高階馬爾可夫模型可以通過當前詞預測下一個詞的概率,為后續語言模型奠定了基礎。

4. 隱馬爾可夫模型 (HMM, 1980s):

HMM主要用于語音識別和自然語言處理中的序列標注任務,如自動分詞和詞性標注。HMM通過狀態轉移概率和輸出概率來預測下一個詞。

5. 神經網絡語言模型 (2000s):

隨著深度學習的興起,神經網絡開始用于語言模型。例如,Bengio等人提出的模型通過前向傳播來預測下一個詞的概率。

6. RNN語言模型 (2000s):

循環神經網絡(RNN)通過隱藏層的狀態傳遞來捕捉序列中的長期依賴關系,從而預測下一個詞的概率。

7. LSTM (1997):

長短期記憶網絡(LSTM)是一種特殊的RNN,通過門控機制更好地捕捉長期依賴關系,從而提高對下一個詞預測的準確性。

8. Word2Vec (2013):

雖然主要目的是生成詞向量,但它通過淺層神經網絡來預測上下文中的詞,間接影響了后續的語言模型。

9. GloVe (2014):

通過全局詞頻統計來訓練詞向量,雖然不直接用于預測下一個詞,但為后續模型提供了豐富的語義信息。

10. Transformer (2017):

基于注意力機制的模型架構,通過自注意力機制捕捉全局依賴關系,從而更準確地預測下一個詞的概率。

11. BERT (2018):

通過雙向編碼器表示從Transformer而來,通過預訓練和微調的方法在各種NLP任務上取得了突破性的成果。雖然主要是雙向模型,但在某些應用中仍涉及預測下一個詞的概率。

12. GPT系列 (2018-至今):

a. GPT-1 (2018): 生成式預訓練模型,展示了強大的文本生成能力。

b. GPT-2 (2019): 增加了模型規模,提升了性能。

c. GPT-3 (2020): 擁有超過1750億參數,成為當時最大的語言模型。

d. InstructGPT (2022): 通過人類反饋強化學習(RLHF)進行微調,提高了指令跟隨能力。

e. ChatGPT (2022): 基于InstructGPT的聊天機器人版本,能夠更流暢地與用戶互動。

f. GPT-4 (2024): 最新版本,進一步增強了模型的能力。

13. T5 (2019):

文本到文本的Transformer模型,可以應用于多種NLP任務,包括文本生成和翻譯,其訓練目標也是預測下一個詞的概率。

14. RoBERTa (2019):

改進了BERT的訓練方法,提高了性能,雖然主要是雙向模型,但在某些應用中仍涉及預測下一個詞的概率。

15. DALL-E (2021):

雖然主要功能是結合文本和圖像生成,但其背后的文本生成部分仍然基于對下一個詞的預測概率。

16. DeepSeek (2025):

中國自主研發的通用大語言模型體系,涵蓋從7B到超千億參數的完整模型矩陣,其核心仍然是通過預測下一個詞的概率來進行文本生成和理解。

用戶所謂對大語言模型的問答,其實仍然是“根據細分概率預測下一個詞”,輸入問題或者提示詞(前件),大語言模型預測并輸出回答(后件)。

基本游戲是“你說上句,我接下句”,并且下句的word是“手拉手”方式逐個產生的。“手拉手”方式逐個產生 是指每新生成一個詞,這個詞都會加入提示詞,構成新的前件,來一起。

那么既然一直是這個思路,為何只有近年(2022)大語言模型才發展到實用階段?

兩個主要原因:

1、首先是算力的擴大(感謝黃仁勛和NVIDA吧),首先使得訓練的巨大計算量能夠在可行的時間內完成,其次實現概率近乎無限地細分,可以把總數多達幾百萬的候選詞的每一個的概率細分到幾百萬分之一。某一個詞的候選概率可能只有0.000001%,但仍然在所有候選詞中脫穎而出,因為其他候選詞的概率比它還要低。以前受限于算力是無法把每個候選詞的候選概率精細化到如此程度的,以前會認為所有這些詞的候選概率都是0。算力的擴大也是近年深度學習出現的原因,神經網絡從十九世紀五十年代便出現,其研究在六七八十年代陷入低谷,在九十年代以后直至今日復興,很大的原因在于早期神經網絡的層數不夠深,權重不夠多,細分能力有限,計算效果不好,根本原因是硬件支持不了“深度”學習,深度的意思很直白,就是神經網絡的層數。

2、第二個重要原因是以transformer為代表的注意力機制,使得大語言模型能夠在不同上下文中動態地分辨每個詞(更專業的,token)的重要性,大幅改善了語言模型回答的“切題性”。在自然語言處理領域,注意力機制的應用不僅僅改善了語言模型的切題性。它還提升了機器翻譯、問答系統、文本摘要等任務的性能。通過對輸入序列中的每個詞進行加權的注意力分配,模型能夠更好地捕捉到重要的語義和上下文信息,從而提高了模型的準確性和輸出質量。

除了自然語言處理,注意力機制也在計算機視覺領域得到廣泛應用。在圖像處理中,注意力機制能夠幫助模型更好地關注感興趣的區域,提高目標檢測、圖像分類和圖像生成等任務的性能。通過學習到的權重,模型能夠聚焦于圖像中與任務相關的重要區域,從而提高模型的準確性和魯棒性。

#03

歷史數據和環境數據增強的定性控車


圖2 車載智腦設計圖,依靠大語言模型來溝通人的定性和機械的定量

如下AI對話來自筆者所在企業本地部署大語言模型(使用deepseek 7B模型),用于車載智腦的預研工作:

問:乘客抱怨車內潮濕悶熱,請給出具體且定量的解決步驟

AI答:

序號

步驟

具體操作

目的

量化指標

1

傳感器檢測

使用溫濕度傳感器檢測車內溫度和濕度,使用空氣質量傳感器檢測空氣質量。

獲取準確的環境數據,了解當前狀況。

溫度:±0.5°C,濕度:±5%,空氣質量:PM2.5≤35μg/m3

2

空調調節

自動調節空調系統的溫度、濕度和風速。

提供舒適的溫度和濕度,減少潮濕悶熱感。

溫度:22-26°C,濕度:40%-60%,風速:低-中

3

通風系統

打開車內通風系統,開啟風扇或空氣凈化器。

減少潮濕感,提高空氣質量。

通風時間:10分鐘,風速:中

4

互動與反饋

通過語音助手詢問乘客是否滿意當前環境,是否需要調整。

根據乘客的反饋和要求主動調整環境條件,確保舒適度。

反饋次數:至少3次

5

提供建議和解決方案

如乘客不滿意,建議調整座椅位置、打開車窗等。

提高乘客的即時舒適度。

建議次數:至少2次

6

報告與維修

向相關維修部門報告問題,記錄故障類型和發生時間。

防止類似問題再次發生,提高整體服務質量。

故障報告:及時提交,維修記錄:詳細記錄

進一步的,我們對車載智腦的設計不僅會把司乘人員的直接語言輸入給大語言模型,而且會結合本車的歷史大數據和實時環境大數據這兩部分信息,來擴展司乘人員的直接語言。

其直接結果是,司乘人員相同的輸入,我們的車載智腦會根據不同時間地點傳感器數據做出不同的定量反應。

比如同樣的乘客抱怨車內潮濕悶熱,車載智腦會分析到在江南春季和在北國冬季(這種數據可以來自車聯網,V2X或者本車傳感器),前者時會建議或者自動打開車窗開度以選擇最節能方案,后者會降低電熱座椅溫度,并打開空調的干燥功能。

#04

一車一腦,隨車微調,萬腦歸宗

在AI界,有一個普遍的共識,即訓練好的神經網絡模型可以理解為“信息壓縮”。也就是訓練好的神經網絡模型是對訓練它的海量數據集的一個“信息壓縮”。

但是這種“信息壓縮”,并沒有保存或泄露任何一條訓練數據。因為訓練好的模型中沒有任何一條訓練數據的原文,有且僅有巨量(數十億到數百億)的浮點數形式的權重參數。這些權重參數雖然體積龐大,但相比于訓練它的訓練數據,體積不及萬分之一。

以筆者本地部署大模型為例,70B的LLM模型,大約占據了40G硬盤空間,但根據報道其訓練數據超過幾百T。

從”神經網絡是數據的信息壓縮“這一角度出發,每輛車上車載智腦(車載大語言模型),或者專為此車服務的云端大語言模型,隨著車輛運行大數據的積累和實時根據新數據微調fine-tune(只會微調,一般不會重訓練大語言模型,因為成本太高)。

每一臺車的車載智腦(本車或者云上)都會積累這輛車獨一無二的信息,車主風格,載貨類型,常走路線的特點,運營區域,主要用途(從模式推斷),磨損情況等等。

企業讀取每一臺車的車載智腦的權重集合,暫時沒有直接侵犯用戶數據隱私(我們相信未來會有法規出臺限制車載獨有大模型間接泄露用戶數據),卻又收集到本企業所有產品的最詳細的數據畫像,用于產品的精細化的、細分市場、細分用戶群體的改進。擁有這樣信息優勢的企業,將會在激烈的競爭中獲得巨大的優勢。

#05

總 結

筆者博士畢業后第一份工作在某為消費者BG(business group)做架構師,架構師們之間流傳一個笑話:我們的產品(手機和平板)只有工科男才能學會使用,而且還得是碩士起步。

言外之意是產品操控方式過于復雜,不僅方式太多(根據經驗統計,一部智能手機從購置到換代,其70%以上的內置功能從沒被使用過,甚至用戶根本不知道這些功能的存在),而且要求用戶必須是科技潮人,能理解大量的科技術語和概念。

而我們架構師團隊的努力方向就是在kiss(keep it simple and stupid)原則下保證“簡化而不減配”,讓小白用戶也能輕松使用。

如今的車輛行業就是10年前的智能手機行業,車輛正在代替手機成為份額最大的智能終端,車輛的功能之豐富,安全性要求之高,價格之昂貴,都遠非手機可比。

駕駛員通過適合人類的定性語言控車,大語言模型(筆者所在企業在設計階段稱為車載智腦)在后臺把定性要求轉化為定量操作指令交給車輛網關、各個域控制器和各個MCU處理執行,然后再把定量執行結果再次轉換為人類理解的定性語言反饋給司乘人員,形成閉環。

本文認為這是大語言模型在車輛行業的No.1用途,并希望在業界引起討論。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
中美在聯合國再交鋒,中方反擊直擊美方軟肋,80余國送出掌聲

中美在聯合國再交鋒,中方反擊直擊美方軟肋,80余國送出掌聲

劉浶開挖機
2025-07-23 22:42:11
她們一邊做飯一邊賣淫

她們一邊做飯一邊賣淫

法律讀品
2025-05-05 17:24:28
為什么維京人以戰死為榮耀,而以老死為屈辱?因為老了很屈辱

為什么維京人以戰死為榮耀,而以老死為屈辱?因為老了很屈辱

帶你感受人間冷暖
2025-07-06 00:10:05
歐文:杜蘭特沒資格說我不投入!納什能來籃網,還是他拍的板

歐文:杜蘭特沒資格說我不投入!納什能來籃網,還是他拍的板

夜白侃球
2025-07-23 21:48:57
游泳世錦賽綜述:中國隊3金3銀排名第二,美國水球無緣獎牌

游泳世錦賽綜述:中國隊3金3銀排名第二,美國水球無緣獎牌

燒體壇
2025-07-23 20:53:06
未來30天,把綠豆湯換成它!連喝2周,濕氣少了、脾胃也舒服了!

未來30天,把綠豆湯換成它!連喝2周,濕氣少了、脾胃也舒服了!

秀廚娘
2025-07-21 16:19:14
上海申花“足協杯不要了”!特謝拉的點球成疑案:進還是沒進?

上海申花“足協杯不要了”!特謝拉的點球成疑案:進還是沒進?

足球大腕
2025-07-23 23:28:01
成吉思汗死亡之謎被揭開,死法或許太過羞恥,史書都不好意思記載

成吉思汗死亡之謎被揭開,死法或許太過羞恥,史書都不好意思記載

芳芳歷史燴
2025-06-09 17:20:02
川普稱接到訪華邀請,出席9·3閱兵有戲,中美俄峰會有望北京舉行

川普稱接到訪華邀請,出席9·3閱兵有戲,中美俄峰會有望北京舉行

影孖看世界
2025-07-23 23:54:58
伊朗高枕無憂了,以色列再也沒機會進行打擊了

伊朗高枕無憂了,以色列再也沒機會進行打擊了

南宮一二
2025-07-22 12:20:33
8月初,事業暴漲,貴人扶持的三個星座,注定一飛沖天

8月初,事業暴漲,貴人扶持的三個星座,注定一飛沖天

小晴星座說
2025-07-23 18:34:47
你遇到過超級主動的女生是啥樣?網友:為什么沒有女人主動接近我

你遇到過超級主動的女生是啥樣?網友:為什么沒有女人主動接近我

娛樂圈人物大賞
2025-04-10 00:30:23
蔣介石唯一女兒有多美?先后嫁給他的“死敵”,晚年繼承天價遺產

蔣介石唯一女兒有多美?先后嫁給他的“死敵”,晚年繼承天價遺產

萬物知識圈
2025-07-22 09:15:53
我軍頂級的軍事天才只有一人,他打的仗,西點軍校復盤也打不出來

我軍頂級的軍事天才只有一人,他打的仗,西點軍校復盤也打不出來

南書房
2025-07-20 20:55:03
加速下跌,廣州樓市房價跌破2.5萬元

加速下跌,廣州樓市房價跌破2.5萬元

風向觀察
2025-07-14 16:51:35
南昌市東湖區城市管理和綜合執法局黨組成員黃德銘主動向組織交代問題

南昌市東湖區城市管理和綜合執法局黨組成員黃德銘主動向組織交代問題

魯中晨報
2025-07-23 18:29:49
皇馬醞釀夏窗清洗!阿隆索通牒6人:要么坐板凳 要么離隊

皇馬醞釀夏窗清洗!阿隆索通牒6人:要么坐板凳 要么離隊

葉青足球世界
2025-07-23 09:15:28
采購吃回扣的腦回路,絕不是一般人能想到的!果然是行行都能出狀元

采購吃回扣的腦回路,絕不是一般人能想到的!果然是行行都能出狀元

明月聊史
2025-05-06 22:12:32
想讓女人上癮,秘訣就是:從三個方面“喂飽”她

想讓女人上癮,秘訣就是:從三個方面“喂飽”她

加油丁小文
2025-07-20 10:00:03
網傳驚天大瓜:宗馥莉結過婚,而且在美國生下一對龍鳳胎

網傳驚天大瓜:宗馥莉結過婚,而且在美國生下一對龍鳳胎

纏師門徒
2025-07-22 12:42:04
2025-07-24 01:44:49
眾調科技Unicdata incentive-icons
眾調科技Unicdata
汽車行業資訊與觀點發布
1617文章數 542關注度
往期回顧 全部

汽車要聞

德系大招放盡 場地極限測試全新奧迪A5L

頭條要聞

印度、孟加拉關切雅魯藏布江下游水電站工程 中方回應

頭條要聞

印度、孟加拉關切雅魯藏布江下游水電站工程 中方回應

體育要聞

英格蘭最紅球星 也是加勒比島國驕傲

娛樂要聞

汪峰森林北同游日本 各帶各娃互不耽誤

財經要聞

律師解析娃哈哈遺產案:遺囑是最大變數

科技要聞

別自嗨了!XREAL徐馳:AI眼鏡只有5歲智商

態度原創

游戲
手機
本地
數碼
公開課

《光環無限》美術組曾用辭職"逼宮":要求用虛幻引擎

手機要聞

iOS 26 Beta 4更新,液態玻璃又調整

本地新聞

這雙丑鞋“泰”辣眼,跪求內娛不要抄作業

數碼要聞

AppleCare+ 為 iPad 和 Apple Watch 帶來防盜和丟失選項

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 马边| 台南县| 浙江省| 屯留县| 手游| 沛县| 石景山区| 出国| 海宁市| 永登县| 白河县| 信丰县| 安宁市| 连江县| 丹棱县| 永胜县| 瑞昌市| 海阳市| 克山县| 西平县| 汤原县| 普安县| 余姚市| 河西区| 罗定市| 大竹县| 宜昌市| 南溪县| 建平县| 福鼎市| 莱州市| 江北区| 临江市| 乡宁县| 枝江市| 娄烦县| 龙游县| 抚州市| 时尚| 东丰县| 镶黄旗|