自AI領(lǐng)軍人物印奇掛帥上任后,千里科技的動作受到了越來越多的外界關(guān)注。自2024年開始,千里科技啟動了以AI+車為核心的戰(zhàn)略轉(zhuǎn)型。在智駕方面,今年3月,千里科技宣布與吉利、邁馳、路特斯等,共同投資設(shè)立智駕合資公司——重慶千里智駕有限公司。
千里智駕的設(shè)立,標(biāo)志著千里科技正式進(jìn)軍智能駕駛領(lǐng)域。
6月23日,千里科技在重慶舉辦發(fā)布會,千里科技聯(lián)席總裁王軍、技術(shù)負(fù)責(zé)人楊沐亮相,面向 L2+級的智能輔助駕駛解決方案——千里智駕1.0也正式發(fā)布。另一方面,千里科技進(jìn)一步披露了面向L3級、L4級別智駕方案的全景路線圖。
根據(jù)規(guī)劃,千里科技將在未來六個月內(nèi)發(fā)布L3級別智駕方案——千里智駕2.0。在2026年下半年,計劃推出面向Robotaxi場景的L4級智駕方案——千里智駕3.0。
就在這場發(fā)布會的前兩天,特斯拉的自動駕駛出租車Robotaxi在得克薩斯州奧斯汀正式登場。特斯拉初步部署了約10輛Robotaxi。根據(jù)馬斯克的口徑,他希望年底前Robotaxi擴展至更多城市,2026年實現(xiàn)數(shù)百萬輛特斯拉上路自動接單。可以說,千里科技3.0踩住了技術(shù)和商業(yè)的節(jié)奏,即避免了前期的巨額虧損,又可以在市場教育完善后拿出更好的“作品”。
進(jìn)入AI時代,千里科技在智駕領(lǐng)域的版圖正在逐步展開。
千里智駕1.0“發(fā)布即上車”,智駕產(chǎn)品路線圖首次公開
千里科技最新發(fā)布的"千里智駕1.0"解決方案,分為基礎(chǔ)版、專業(yè)版和旗艦版三大類別。這是一整套面向第三方整車廠商的智駕平臺方案,將全面覆蓋高、中、低端硬件配置,滿足客戶對于不同價位車型的多樣化需求。
千里智駕1.0方案將最低標(biāo)配100TOPS以上算力。其中,旗艦版方案搭載了高達(dá)700TOPS的行業(yè)頂級算力平臺,可實現(xiàn)多場景自主決策與復(fù)雜交互、車位到車位等核心功能。
今年3月,千里科技和吉利汽車集團基于深度技術(shù)合作,發(fā)布了千里浩瀚智駕系統(tǒng)。其中,千里浩瀚 H3、H5、H7 對應(yīng)于此次發(fā)布的千里智駕1.0方案的三個版本。目前,千里智駕1.0解決方案已在客戶多款車型上搭載,真正實現(xiàn)了“發(fā)布即上車”。
據(jù)雷峰網(wǎng)了解,千里智駕1.0方案將會在第三季度上車。第四季度,千里科技還將會向國家工信部申請L3的準(zhǔn)入。
吉利是千里科技的大股東,而且千里科技也是率先與吉利共同發(fā)布智駕方案。這樣緊密的合作關(guān)系不免讓外界產(chǎn)生一種疑問:雙方到底是一種什么關(guān)系?
對此,王軍表示,吉利是千里科技的戰(zhàn)略合作伙伴,并不只為吉利服務(wù),而是一個提供全棧式解決方案的Tier1公司。因為與吉利合作,所以雙方確定了千里浩瀚的方案名稱。對于其他客戶,千里同樣可以合作推出名為“千里A”方案、“千里B”方案。
千里科技將自己的智能化戰(zhàn)略歸結(jié)為“一橫一縱”:橫向上,千里科技要做技術(shù)整合,集公司所有的產(chǎn)業(yè)資源,將各自獨立的感知、規(guī)控和執(zhí)行模塊整合為大模型驅(qū)動的全棧端到端方案;縱向上,要做產(chǎn)品整合,將傳感器、控制器、執(zhí)行器等產(chǎn)品整合為全套系統(tǒng)。
因此,這就不意味著千里科技要全棧自研軟硬件,而是選擇產(chǎn)業(yè)鏈里最優(yōu)秀、最好的產(chǎn)品,通過整體的解決方案給到客戶。王軍總結(jié)到,“千里科技的自身定位是“弱水三千,只取一瓢”,不會什么都做,但是會做最關(guān)鍵,也是最終能給客戶帶來核心價值的一部分。 ”
加入千里科技前,王軍曾有很長一段時間在日韓等地工作的經(jīng)驗,因此也見證了日韓等大型Tier1隨本國車企出海的案例。據(jù)雷峰網(wǎng)了解,在市場方面,今后千里科技還會與幾家國內(nèi)客戶深度合作,同時也會積極拓展海外客戶。“海外是更廣闊的市場,我們作為一個零部件供應(yīng)商,要跟隨中國車企逐步走向海外,做B端大客戶生意。”
聯(lián)合研發(fā)千里智駕RLM大模型,多模態(tài)和強化學(xué)習(xí)范式行業(yè)領(lǐng)先
正如上文所說,千里智駕的成立是在今年,而一個現(xiàn)實情況是智能駕駛的發(fā)展已至下半場,地平線、華為、Momenta等方案供應(yīng)商分占了大部分市場。擺在千里科技面前的問題是:如何突圍,靠什么去打動主機廠客戶?
王軍認(rèn)為,雖然現(xiàn)在涌現(xiàn)出了很多的智駕技術(shù)方案,但是從智能化走到AI化后,大家真正認(rèn)可了“端到端+大模型”的發(fā)展方向。如果以這一方向為基準(zhǔn)線,大家的轉(zhuǎn)型和儲備時間都不長,都在同一起跑線。
從2021年開始,作為曠視聯(lián)創(chuàng)的楊沐及其代表的團隊就投入大模型以及在自動駕駛領(lǐng)域落地的工作。楊沐表示,為什么千里科技從2021年開始投入智駕的研發(fā),也是因為原先的技術(shù)路線已經(jīng)到了一個轉(zhuǎn)折期——從規(guī)則驅(qū)動開始走向數(shù)據(jù)驅(qū)動。
在這一轉(zhuǎn)型過程中,VLM是一個關(guān)鍵的技術(shù)節(jié)點,起到了承上啟下的作用。
最早的輔助駕駛采用模塊化架構(gòu),由于感知、規(guī)劃及執(zhí)行系統(tǒng)相對獨立,且每個步驟都要占用一定的計算時間,整體系統(tǒng)的響應(yīng)較慢,信息也有損耗。后來,在特斯拉的帶領(lǐng)下,端到端的概念興起,通過喂養(yǎng)“人類駕駛行為”可以應(yīng)對大部分泛化場景,但仍然很難解決從未遇到過或特別復(fù)雜的問題,這時候就需要VLM的配合。
VLM就像是一個外掛,是車輛的“副駕駛教練”,通過圖像識別和語義分析理解復(fù)雜交通場景,并為自動駕駛系統(tǒng)提供決策支持。
舉一個簡單的例子:早期并不在智駕主流圈的理想,正是在2024年通過“端到端+VLM”的技術(shù)組合成功躋身第一梯隊。這直接證明了在“AI+車”時代,原本的技術(shù)范式與行業(yè)格局已經(jīng)被打破,VLM成為下一個搶占技術(shù)制高點的利器,這也是千里科技的核心競爭力所在。
千里科技的大模型合作伙伴是階躍星辰。經(jīng)過聯(lián)合研發(fā),千里科技基于階躍星辰行業(yè)一流的多模態(tài)基礎(chǔ)大模型底座、領(lǐng)先的強化學(xué)習(xí)范式,推出了全新的千里智駕RLM大模型。
在楊沐看來,前沿的大模型具備極高的能力上限,通過與階躍星辰的深度技術(shù)合作,能將在大模型行業(yè)經(jīng)過充分驗證的能力快速遷移至智駕領(lǐng)域,從而推動智駕大模型的研發(fā)落地。
千里智駕RLM大模型,全面覆蓋基礎(chǔ)大模型訓(xùn)練、智駕數(shù)據(jù)特訓(xùn),以及強化學(xué)習(xí)三個密切相關(guān)的環(huán)節(jié)。
第一,在大模型預(yù)訓(xùn)練階段,基于強大的多模態(tài)基礎(chǔ)大模型,海量的、跨領(lǐng)域的數(shù)據(jù)積累帶來了更好的數(shù)據(jù)生成能力,以及更強的通識性,從而大幅提升了智駕大模型的智力上限。
第二,在智駕數(shù)據(jù)特訓(xùn)階段,利用駕駛場景的專用數(shù)據(jù)集,對基礎(chǔ)模型進(jìn)行特訓(xùn)和調(diào)優(yōu),以確保智駕系統(tǒng)能在車端較低算力條件下,仍能保持充分的泛化性。
第三,在強化學(xué)習(xí)階段,通過設(shè)置獎勵模型(reward model),降低對數(shù)據(jù)分布的強依賴,抑制不良駕駛行為的出現(xiàn)概率,并進(jìn)一步降低了兜底規(guī)則接管的頻率。
這三個環(huán)節(jié)就像是將一個兒童培養(yǎng)成“老司機”的過程:兒童具備認(rèn)知世界的基礎(chǔ)能力,通過眼、耳、鼻等“多模態(tài)傳感器”接收外界信息;第二個階段就是接受駕校教練的培訓(xùn),學(xué)習(xí)交通法規(guī)、路面標(biāo)志以及上路實踐,最終拿到駕照;第三個階段就是上路實習(xí),通過規(guī)避剮蹭、急剎等極端場景的能力提升,最終成為一個能應(yīng)對各種情況的“老司機”。
這三個環(huán)節(jié)中,最難的仍然是最后一個。例如,如何解決系統(tǒng)壓實線的問題。有些團隊的傳統(tǒng)做法是將所有的上傳數(shù)據(jù)清洗一遍,刪除所有有壓線行為的數(shù)據(jù),這種做法耗時費力,也顯得不AI。
千里智駕RLM大模型正是通過強化學(xué)習(xí)的方式,避免了上述方式的弊端,途徑是獎勵模型會提供更連續(xù)、泛化、更多維的獎勵信息給到強化學(xué)習(xí)。簡而言之,告訴智駕“什么是好的”,并以此讓系統(tǒng)盡可能接近這些表現(xiàn)。這就有點類似于AlphaGo與AlphaZero,后者通過自我博弈和學(xué)習(xí)實現(xiàn)了比前者更強的泛化性能。另外,還有蔚來等車企通過設(shè)置“世界模型”,構(gòu)建一個實時建模和反饋系統(tǒng),幫助大模型突破過去“模仿學(xué)習(xí)”的窠臼,這也是一種可取的方法。
當(dāng)然,從今年開始,業(yè)內(nèi)正在推進(jìn)VLA技術(shù)的落地應(yīng)用。在一些業(yè)內(nèi)人士的眼中,VLM是端到端1.0的一次技術(shù)優(yōu)化,而真正的2.0換代升級是VLA。
與傳統(tǒng)的視覺語言模型VLM相比,VLA的優(yōu)勢在于其不僅可以解析圖像和文本信息,還能實現(xiàn)類人推理與全局理解。不過,VLA上車還面臨一些難點,比如車端算力不足,理想車端雙Orin-X芯片運行端到端+VLM算力已經(jīng)比較吃緊。而VLA的模型結(jié)構(gòu)更復(fù)雜,參數(shù)也會進(jìn)一步擴大,對硬件算力和數(shù)據(jù)閉環(huán)的迭代能力要求就更高。
楊沐和王軍都認(rèn)為,千里科技正在通過VLM去實現(xiàn)業(yè)界所需要的VLA功能。
事實上,業(yè)內(nèi)的研究成果也正在沿著這一方向前進(jìn)。
2025年1月,來自清華、伯克利分校和上海姚期智研究院的論文“Improving Vision-Language-Action Model with Online Reinforcement Learning”,已成功地將VLM通過使用專家機器人數(shù)據(jù)集進(jìn)行監(jiān)督微調(diào)(SFT) 集成到低級機器人控制中,從而產(chǎn)生視覺-語言-動作 (VLA) 模型。
除了基于強化學(xué)習(xí)的智駕大模型,千里科技還發(fā)布了新一代以 AI Agent 為核心的智能座艙產(chǎn)品方案。該產(chǎn)品方案具備多模態(tài)融合的超自然交互、基于全融合地圖的人機共駕、第三生活空間,以及端云一體的融合記憶等特性,旨在將座艙打造成一個“超級AI Agent”。
據(jù)王軍透露,千里科技將會在2025年Q4發(fā)布新一代智能座艙產(chǎn)品。
雙線并行,積極卡位
從2025年開始,大規(guī)模普及的智駕浪潮將帶動新一輪市場洗牌,兩極分化的現(xiàn)象正在出現(xiàn)。
一類是向下的“智駕平權(quán)”類代表如比亞迪、吉利,將智駕成本卷到最低,強調(diào)覆蓋率;一類是向上的“智駕理想”代表如理想、小鵬,要做難度更高、更接近于人類決策流程的智駕系統(tǒng)。目前,理想已開始研發(fā)下一代VLA智駕大模型,目標(biāo)在今年下半年實現(xiàn)項目落地。吉利汽車和元戎啟行也在積極推動VLA,各家都在比拼落地時間。
從這次發(fā)布會可以看到,千里科技的智駕方案涵蓋了從低到高的各類智駕需求,并且在L3/L4的布局上也正在積極卡位。
2023年,印奇曾判斷AI未來會沿兩大方向演進(jìn):一是AIinDigital,以 ChatGPT為代表的技術(shù),給數(shù)字世界帶來新技術(shù)范式的遷移;二是AIinPhysical,以特斯拉為代表的企業(yè),將AI技術(shù)引擎與硬件載體結(jié)合,產(chǎn)生自動駕駛、機器人等不同類型的智能機器,改造物理世界。
而千里科技延續(xù)了印奇所提的“軟硬一體化”戰(zhàn)略,這是其區(qū)別于其他很多AI公司的一個特征。千里科技的“AI+車”,既是軟硬件一體的代表,也是未來AI乃至物理世界的一個豐富載體。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.