千里智駕RLM大模型，是智駕系統(tǒng)的下一條通路

2025-06-26 19:02:09　來源: 雷峰網(wǎng)

北京舉報

分享至

自AI領(lǐng)軍人物印奇掛帥上任后，千里科技的動作受到了越來越多的外界關(guān)注。自2024年開始，千里科技啟動了以AI+車為核心的戰(zhàn)略轉(zhuǎn)型。在智駕方面，今年3月，千里科技宣布與吉利、邁馳、路特斯等，共同投資設(shè)立智駕合資公司——重慶千里智駕有限公司。

千里智駕的設(shè)立，標(biāo)志著千里科技正式進(jìn)軍智能駕駛領(lǐng)域。

6月23日，千里科技在重慶舉辦發(fā)布會，千里科技聯(lián)席總裁王軍、技術(shù)負(fù)責(zé)人楊沐亮相，面向 L2+級的智能輔助駕駛解決方案——千里智駕1.0也正式發(fā)布。另一方面，千里科技進(jìn)一步披露了面向L3級、L4級別智駕方案的全景路線圖。

根據(jù)規(guī)劃，千里科技將在未來六個月內(nèi)發(fā)布L3級別智駕方案——千里智駕2.0。在2026年下半年，計劃推出面向Robotaxi場景的L4級智駕方案——千里智駕3.0。

就在這場發(fā)布會的前兩天，特斯拉的自動駕駛出租車Robotaxi在得克薩斯州奧斯汀正式登場。特斯拉初步部署了約10輛Robotaxi。根據(jù)馬斯克的口徑，他希望年底前Robotaxi擴展至更多城市，2026年實現(xiàn)數(shù)百萬輛特斯拉上路自動接單。可以說，千里科技3.0踩住了技術(shù)和商業(yè)的節(jié)奏，即避免了前期的巨額虧損，又可以在市場教育完善后拿出更好的“作品”。

進(jìn)入AI時代，千里科技在智駕領(lǐng)域的版圖正在逐步展開。

千里智駕1.0“發(fā)布即上車”，智駕產(chǎn)品路線圖首次公開

千里科技最新發(fā)布的"千里智駕1.0"解決方案，分為基礎(chǔ)版、專業(yè)版和旗艦版三大類別。這是一整套面向第三方整車廠商的智駕平臺方案，將全面覆蓋高、中、低端硬件配置，滿足客戶對于不同價位車型的多樣化需求。

千里智駕1.0方案將最低標(biāo)配100TOPS以上算力。其中，旗艦版方案搭載了高達(dá)700TOPS的行業(yè)頂級算力平臺，可實現(xiàn)多場景自主決策與復(fù)雜交互、車位到車位等核心功能。

今年3月，千里科技和吉利汽車集團基于深度技術(shù)合作，發(fā)布了千里浩瀚智駕系統(tǒng)。其中，千里浩瀚 H3、H5、H7 對應(yīng)于此次發(fā)布的千里智駕1.0方案的三個版本。目前，千里智駕1.0解決方案已在客戶多款車型上搭載，真正實現(xiàn)了“發(fā)布即上車”。

據(jù)雷峰網(wǎng)了解，千里智駕1.0方案將會在第三季度上車。第四季度，千里科技還將會向國家工信部申請L3的準(zhǔn)入。

吉利是千里科技的大股東，而且千里科技也是率先與吉利共同發(fā)布智駕方案。這樣緊密的合作關(guān)系不免讓外界產(chǎn)生一種疑問：雙方到底是一種什么關(guān)系？

對此，王軍表示，吉利是千里科技的戰(zhàn)略合作伙伴，并不只為吉利服務(wù)，而是一個提供全棧式解決方案的Tier1公司。因為與吉利合作，所以雙方確定了千里浩瀚的方案名稱。對于其他客戶，千里同樣可以合作推出名為“千里A”方案、“千里B”方案。

千里科技將自己的智能化戰(zhàn)略歸結(jié)為“一橫一縱”：橫向上，千里科技要做技術(shù)整合，集公司所有的產(chǎn)業(yè)資源，將各自獨立的感知、規(guī)控和執(zhí)行模塊整合為大模型驅(qū)動的全棧端到端方案；縱向上，要做產(chǎn)品整合，將傳感器、控制器、執(zhí)行器等產(chǎn)品整合為全套系統(tǒng)。

因此，這就不意味著千里科技要全棧自研軟硬件，而是選擇產(chǎn)業(yè)鏈里最優(yōu)秀、最好的產(chǎn)品，通過整體的解決方案給到客戶。王軍總結(jié)到，“千里科技的自身定位是“弱水三千，只取一瓢”，不會什么都做，但是會做最關(guān)鍵，也是最終能給客戶帶來核心價值的一部分。 ”

加入千里科技前，王軍曾有很長一段時間在日韓等地工作的經(jīng)驗，因此也見證了日韓等大型Tier1隨本國車企出海的案例。據(jù)雷峰網(wǎng)了解，在市場方面，今后千里科技還會與幾家國內(nèi)客戶深度合作，同時也會積極拓展海外客戶。“海外是更廣闊的市場，我們作為一個零部件供應(yīng)商，要跟隨中國車企逐步走向海外，做B端大客戶生意。”

聯(lián)合研發(fā)千里智駕RLM大模型，多模態(tài)和強化學(xué)習(xí)范式行業(yè)領(lǐng)先

正如上文所說，千里智駕的成立是在今年，而一個現(xiàn)實情況是智能駕駛的發(fā)展已至下半場，地平線、華為、Momenta等方案供應(yīng)商分占了大部分市場。擺在千里科技面前的問題是：如何突圍，靠什么去打動主機廠客戶？

王軍認(rèn)為，雖然現(xiàn)在涌現(xiàn)出了很多的智駕技術(shù)方案，但是從智能化走到AI化后，大家真正認(rèn)可了“端到端+大模型”的發(fā)展方向。如果以這一方向為基準(zhǔn)線，大家的轉(zhuǎn)型和儲備時間都不長，都在同一起跑線。

從2021年開始，作為曠視聯(lián)創(chuàng)的楊沐及其代表的團隊就投入大模型以及在自動駕駛領(lǐng)域落地的工作。楊沐表示，為什么千里科技從2021年開始投入智駕的研發(fā)，也是因為原先的技術(shù)路線已經(jīng)到了一個轉(zhuǎn)折期——從規(guī)則驅(qū)動開始走向數(shù)據(jù)驅(qū)動。

在這一轉(zhuǎn)型過程中，VLM是一個關(guān)鍵的技術(shù)節(jié)點，起到了承上啟下的作用。

最早的輔助駕駛采用模塊化架構(gòu)，由于感知、規(guī)劃及執(zhí)行系統(tǒng)相對獨立，且每個步驟都要占用一定的計算時間，整體系統(tǒng)的響應(yīng)較慢，信息也有損耗。后來，在特斯拉的帶領(lǐng)下，端到端的概念興起，通過喂養(yǎng)“人類駕駛行為”可以應(yīng)對大部分泛化場景，但仍然很難解決從未遇到過或特別復(fù)雜的問題，這時候就需要VLM的配合。

VLM就像是一個外掛，是車輛的“副駕駛教練”，通過圖像識別和語義分析理解復(fù)雜交通場景，并為自動駕駛系統(tǒng)提供決策支持。

舉一個簡單的例子：早期并不在智駕主流圈的理想，正是在2024年通過“端到端+VLM”的技術(shù)組合成功躋身第一梯隊。這直接證明了在“AI+車”時代，原本的技術(shù)范式與行業(yè)格局已經(jīng)被打破，VLM成為下一個搶占技術(shù)制高點的利器，這也是千里科技的核心競爭力所在。

千里科技的大模型合作伙伴是階躍星辰。經(jīng)過聯(lián)合研發(fā)，千里科技基于階躍星辰行業(yè)一流的多模態(tài)基礎(chǔ)大模型底座、領(lǐng)先的強化學(xué)習(xí)范式，推出了全新的千里智駕RLM大模型。

在楊沐看來，前沿的大模型具備極高的能力上限，通過與階躍星辰的深度技術(shù)合作，能將在大模型行業(yè)經(jīng)過充分驗證的能力快速遷移至智駕領(lǐng)域，從而推動智駕大模型的研發(fā)落地。

千里智駕RLM大模型，全面覆蓋基礎(chǔ)大模型訓(xùn)練、智駕數(shù)據(jù)特訓(xùn)，以及強化學(xué)習(xí)三個密切相關(guān)的環(huán)節(jié)。

第一，在大模型預(yù)訓(xùn)練階段，基于強大的多模態(tài)基礎(chǔ)大模型，海量的、跨領(lǐng)域的數(shù)據(jù)積累帶來了更好的數(shù)據(jù)生成能力，以及更強的通識性，從而大幅提升了智駕大模型的智力上限。

第二，在智駕數(shù)據(jù)特訓(xùn)階段，利用駕駛場景的專用數(shù)據(jù)集，對基礎(chǔ)模型進(jìn)行特訓(xùn)和調(diào)優(yōu)，以確保智駕系統(tǒng)能在車端較低算力條件下，仍能保持充分的泛化性。

第三，在強化學(xué)習(xí)階段，通過設(shè)置獎勵模型（reward model），降低對數(shù)據(jù)分布的強依賴，抑制不良駕駛行為的出現(xiàn)概率，并進(jìn)一步降低了兜底規(guī)則接管的頻率。

這三個環(huán)節(jié)就像是將一個兒童培養(yǎng)成“老司機”的過程：兒童具備認(rèn)知世界的基礎(chǔ)能力，通過眼、耳、鼻等“多模態(tài)傳感器”接收外界信息；第二個階段就是接受駕校教練的培訓(xùn)，學(xué)習(xí)交通法規(guī)、路面標(biāo)志以及上路實踐，最終拿到駕照；第三個階段就是上路實習(xí)，通過規(guī)避剮蹭、急剎等極端場景的能力提升，最終成為一個能應(yīng)對各種情況的“老司機”。

這三個環(huán)節(jié)中，最難的仍然是最后一個。例如，如何解決系統(tǒng)壓實線的問題。有些團隊的傳統(tǒng)做法是將所有的上傳數(shù)據(jù)清洗一遍，刪除所有有壓線行為的數(shù)據(jù)，這種做法耗時費力，也顯得不AI。

千里智駕RLM大模型正是通過強化學(xué)習(xí)的方式，避免了上述方式的弊端，途徑是獎勵模型會提供更連續(xù)、泛化、更多維的獎勵信息給到強化學(xué)習(xí)。簡而言之，告訴智駕“什么是好的”，并以此讓系統(tǒng)盡可能接近這些表現(xiàn)。這就有點類似于AlphaGo與AlphaZero，后者通過自我博弈和學(xué)習(xí)實現(xiàn)了比前者更強的泛化性能。另外，還有蔚來等車企通過設(shè)置“世界模型”，構(gòu)建一個實時建模和反饋系統(tǒng)，幫助大模型突破過去“模仿學(xué)習(xí)”的窠臼，這也是一種可取的方法。

當(dāng)然，從今年開始，業(yè)內(nèi)正在推進(jìn)VLA技術(shù)的落地應(yīng)用。在一些業(yè)內(nèi)人士的眼中，VLM是端到端1.0的一次技術(shù)優(yōu)化，而真正的2.0換代升級是VLA。

與傳統(tǒng)的視覺語言模型VLM相比，VLA的優(yōu)勢在于其不僅可以解析圖像和文本信息，還能實現(xiàn)類人推理與全局理解。不過，VLA上車還面臨一些難點，比如車端算力不足，理想車端雙Orin-X芯片運行端到端+VLM算力已經(jīng)比較吃緊。而VLA的模型結(jié)構(gòu)更復(fù)雜，參數(shù)也會進(jìn)一步擴大，對硬件算力和數(shù)據(jù)閉環(huán)的迭代能力要求就更高。

楊沐和王軍都認(rèn)為，千里科技正在通過VLM去實現(xiàn)業(yè)界所需要的VLA功能。

事實上，業(yè)內(nèi)的研究成果也正在沿著這一方向前進(jìn)。

2025年1月，來自清華、伯克利分校和上海姚期智研究院的論文“Improving Vision-Language-Action Model with Online Reinforcement Learning”，已成功地將VLM通過使用專家機器人數(shù)據(jù)集進(jìn)行監(jiān)督微調(diào)(SFT) 集成到低級機器人控制中，從而產(chǎn)生視覺-語言-動作 (VLA) 模型。

除了基于強化學(xué)習(xí)的智駕大模型，千里科技還發(fā)布了新一代以 AI Agent 為核心的智能座艙產(chǎn)品方案。該產(chǎn)品方案具備多模態(tài)融合的超自然交互、基于全融合地圖的人機共駕、第三生活空間，以及端云一體的融合記憶等特性，旨在將座艙打造成一個“超級AI Agent”。

據(jù)王軍透露，千里科技將會在2025年Q4發(fā)布新一代智能座艙產(chǎn)品。

雙線并行，積極卡位

從2025年開始，大規(guī)模普及的智駕浪潮將帶動新一輪市場洗牌，兩極分化的現(xiàn)象正在出現(xiàn)。

一類是向下的“智駕平權(quán)”類代表如比亞迪、吉利，將智駕成本卷到最低，強調(diào)覆蓋率；一類是向上的“智駕理想”代表如理想、小鵬，要做難度更高、更接近于人類決策流程的智駕系統(tǒng)。目前，理想已開始研發(fā)下一代VLA智駕大模型，目標(biāo)在今年下半年實現(xiàn)項目落地。吉利汽車和元戎啟行也在積極推動VLA，各家都在比拼落地時間。

從這次發(fā)布會可以看到，千里科技的智駕方案涵蓋了從低到高的各類智駕需求，并且在L3/L4的布局上也正在積極卡位。

2023年，印奇曾判斷AI未來會沿兩大方向演進(jìn)：一是AIinDigital,以 ChatGPT為代表的技術(shù)，給數(shù)字世界帶來新技術(shù)范式的遷移；二是AIinPhysical，以特斯拉為代表的企業(yè)，將AI技術(shù)引擎與硬件載體結(jié)合，產(chǎn)生自動駕駛、機器人等不同類型的智能機器，改造物理世界。

而千里科技延續(xù)了印奇所提的“軟硬一體化”戰(zhàn)略，這是其區(qū)別于其他很多AI公司的一個特征。千里科技的“AI+車”，既是軟硬件一體的代表，也是未來AI乃至物理世界的一個豐富載體。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.