端到端類(lèi)腦自動(dòng)駕駛 | DeepSeek如何影響國(guó)內(nèi)智能汽車(chē)行業(yè)
本文來(lái)源:智車(chē)科技
國(guó)內(nèi)智能汽車(chē)行業(yè)正經(jīng)歷一場(chǎng)由AI驅(qū)動(dòng)的技術(shù)變革,而DeepSeek憑借其開(kāi)源生態(tài)與高效訓(xùn)練能力,迅速引起國(guó)內(nèi)車(chē)企的共情和合作。在傳統(tǒng)汽車(chē)向“軟件定義汽車(chē)”轉(zhuǎn)型的浪潮下,車(chē)聯(lián)網(wǎng)、自動(dòng)駕駛等技術(shù)的迭代對(duì)算力與研發(fā)成本提出了更高要求。
開(kāi)源+高效訓(xùn)練
車(chē)企擁抱DeepSeek的底層邏輯
DeepSeek的開(kāi)源模式為汽車(chē)行業(yè)提供了新思路。
2月6日,吉利汽車(chē)宣布自研大模型星睿與DeepSeek已完成深度融合。吉利將對(duì)星睿車(chē)控FunctionCall大模型、汽車(chē)主動(dòng)交互端側(cè)大模型等進(jìn)行蒸餾訓(xùn)練。屆時(shí),吉利智能汽車(chē)AI不僅能對(duì)用戶(hù)的模糊意圖實(shí)現(xiàn)精準(zhǔn)理解,進(jìn)而準(zhǔn)確調(diào)用約2000個(gè)車(chē)載接口,還能基于車(chē)內(nèi)外場(chǎng)景主動(dòng)分析用戶(hù)潛在需求,并為用戶(hù)主動(dòng)提供車(chē)輛控制、主動(dòng)對(duì)話、售后等服務(wù),智能交互體驗(yàn)將大幅提升。
2月7日,嵐圖汽車(chē)旗下車(chē)型嵐圖知音完成與DeepSeek模型的深度融合,成為汽車(chē)行業(yè)首個(gè)搭載該技術(shù)的量產(chǎn)車(chē)型。此前,嵐圖座艙已完成DeepSeek全系列模型接入和部署,AI智能體將在云端與DeepSeek大模型融合,帶來(lái)精準(zhǔn)智能交互體驗(yàn)。
圖1 吉利凌渡座艙,搭載吉利與DeepSeek整合AI模型
業(yè)界的普遍共識(shí)是,汽車(chē)行業(yè)正在從傳統(tǒng)的電動(dòng)汽車(chē)(EVs)向智能電動(dòng)汽車(chē)(EIVs)演變。AI和云計(jì)算正在推動(dòng)新能源汽車(chē)競(jìng)爭(zhēng)力。AI和云計(jì)算的整合已成為中國(guó)新能源汽車(chē)(NEV)市場(chǎng)的一個(gè)重要趨勢(shì)。汽車(chē)制造商正在利用這些技術(shù)提升車(chē)輛性能,為用戶(hù)提供更個(gè)性化的駕駛體驗(yàn)。
在近期于達(dá)沃斯舉行的世界經(jīng)濟(jì)論壇上,寧德時(shí)代聯(lián)席主席潘健強(qiáng)調(diào),智能與中國(guó)電動(dòng)汽車(chē)市場(chǎng)的快速增長(zhǎng)密不可分。他表示,電力和智能的無(wú)縫整合是這一轉(zhuǎn)型的關(guān)鍵。他強(qiáng)調(diào),電動(dòng)力為汽車(chē)提供了先進(jìn)的智能功能,結(jié)合DeepSeek類(lèi)大模型,將進(jìn)一步鞏固了中國(guó)在全球智能電動(dòng)汽車(chē)領(lǐng)域的領(lǐng)導(dǎo)地位。
在追求模型高效落地的過(guò)程中,蒸餾(Distillation)技術(shù)成為DeepSeek賦能車(chē)企的另一張王牌。傳統(tǒng)大模型雖性能強(qiáng)悍,但高昂的存儲(chǔ)與運(yùn)行成本使其難以適配車(chē)載場(chǎng)景。DeepSeek R1通過(guò)知識(shí)蒸餾,將大型語(yǔ)言模型的“經(jīng)驗(yàn)”遷移至輕量化模型中,既保留了核心能力,又大幅降低了硬件負(fù)載。據(jù)悉,吉利將對(duì)星睿車(chē)控 FunctionCall 大模型、汽車(chē)主動(dòng)交互端側(cè)大模型等進(jìn)行蒸餾訓(xùn)練,將DeepSeek R1的語(yǔ)義理解與優(yōu)先級(jí)決策能力注入車(chē)輛控制模塊,這種“類(lèi)人思考”的決策邏輯,將為車(chē)企在成本與性能間找到了平衡點(diǎn),加速了AI模型從實(shí)驗(yàn)室到量產(chǎn)車(chē)的轉(zhuǎn)化。
DeepSeek在智能車(chē)輛行業(yè)的未來(lái)擴(kuò)展
-類(lèi)腦思考的端到端自動(dòng)駕駛
在自動(dòng)駕駛領(lǐng)域,還沒(méi)有自動(dòng)駕駛模型在大數(shù)據(jù)統(tǒng)計(jì)檢驗(yàn)意義上公認(rèn)優(yōu)于人類(lèi)駕駛員。如何讓機(jī)器理解“人類(lèi)用語(yǔ)義表達(dá)的操作優(yōu)先級(jí)”,這正是DeepSeek和其它潛在大語(yǔ)言模型最好的切入點(diǎn)之一。而且,這種技術(shù)切入是融合到最新的端到端(end to end)自動(dòng)駕駛技術(shù)潮流的。
圖2 三階段和端到端自動(dòng)駕駛對(duì)比,圖片來(lái)自Research Gate
傳統(tǒng)的自動(dòng)駕駛系統(tǒng)通常由多個(gè)獨(dú)立的模塊或者階段組成,如感知、決策和控制。而端到端自動(dòng)駕駛技術(shù)試圖通過(guò)將這些模塊整合成一個(gè)統(tǒng)一的龐大神經(jīng)網(wǎng)絡(luò)模型,直接將原始傳感器輸入(圖像、點(diǎn)云、超聲波雷達(dá)等等)映射到車(chē)輛的控制命令,以實(shí)現(xiàn)自動(dòng)駕駛的功能。
具體而言,端到端自動(dòng)駕駛技術(shù)將原始傳感器數(shù)據(jù)(如攝像頭、雷達(dá)和激光雷達(dá))作為輸入,并通過(guò)深度學(xué)習(xí)網(wǎng)絡(luò)進(jìn)行處理,直接輸出車(chē)輛的控制命令(如方向盤(pán)轉(zhuǎn)角、油門(mén)和剎車(chē))。這種方法消除了傳統(tǒng)自動(dòng)駕駛系統(tǒng)中的中間步驟和模塊,簡(jiǎn)化了系統(tǒng)的設(shè)計(jì)和實(shí)施過(guò)程。
端到端自動(dòng)駕駛技術(shù)的主要優(yōu)勢(shì)在于它可以通過(guò)使用大規(guī)模的數(shù)據(jù)集進(jìn)行端到端的訓(xùn)練,從而提高系統(tǒng)的性能和魯棒性。它能夠從原始數(shù)據(jù)中學(xué)習(xí)到更高級(jí)別的特征和抽象表示,自動(dòng)發(fā)現(xiàn)和理解復(fù)雜的交通場(chǎng)景和駕駛行為。此外,端到端自動(dòng)駕駛技術(shù)還能夠適應(yīng)不同的道路和環(huán)境條件,具有更好的泛化能力。
端到端自動(dòng)駕駛技術(shù)有許多潛在的優(yōu)勢(shì),但它的優(yōu)勢(shì)面也同步帶來(lái)對(duì)應(yīng)的劣勢(shì),如對(duì)大規(guī)模數(shù)據(jù)的需求、對(duì)計(jì)算資源的要求以及解釋性和安全性等問(wèn)題。其中最大的潛在劣勢(shì)是最終結(jié)果的統(tǒng)一單一模型可能極為龐大,帶來(lái)巨大的存儲(chǔ)、訓(xùn)練,運(yùn)行開(kāi)銷(xiāo)和巨大的能耗。因此,盡管業(yè)界普遍接受端到端方案是自動(dòng)駕駛的未來(lái),但主要實(shí)踐端到端自駕的還是巨頭Tesla。
一般而言,作為現(xiàn)狀的當(dāng)前自動(dòng)駕駛系統(tǒng)通常采用混合方法,結(jié)合傳統(tǒng)的模塊化方法和端到端技術(shù),以實(shí)現(xiàn)更可靠和安全的自動(dòng)駕駛功能。
那么如果有一個(gè)破局者,具有低訓(xùn)練成本、低使用成本,最終模型采用蒸餾distillation技術(shù)極小化,又能理解“人類(lèi)用語(yǔ)義表達(dá)的操作優(yōu)先級(jí)”如何呢?
這個(gè)回答似乎是訓(xùn)練費(fèi)用560w美元,單個(gè)token使用費(fèi)用約chatGPT o1的三十分之一,且不依賴(lài)海外高端芯片的DeepSeek R1,以及它的多模態(tài)前身DeepSeek V3。
圖3 學(xué)術(shù)界使用多模態(tài)大語(yǔ)言模型LLM處理自動(dòng)駕駛傳感器輸入的多模態(tài)數(shù)據(jù)(來(lái)自next-GPT)
隨著智能駕駛向“全場(chǎng)景化”邁進(jìn),端到端(End-to-End)技術(shù)成為行業(yè)競(jìng)爭(zhēng)的高地。傳統(tǒng)自動(dòng)駕駛依賴(lài)感知、決策、控制分階段執(zhí)行的模塊化架構(gòu),存在系統(tǒng)復(fù)雜、響應(yīng)延遲等短板。DeepSeek通過(guò)多模態(tài)大模型,將傳感器數(shù)據(jù)直接映射為控制指令,構(gòu)建起“輸入-輸出”一體化的新范式。
以DriveGPT4、商湯DriveAGI、Senna架構(gòu)為代表的端到端方案,已展現(xiàn)出顯著優(yōu)勢(shì)。
1.DriveGPT4:DriveGPT4是將大模型應(yīng)用于可解釋的端到端自動(dòng)駕駛的一個(gè)重要里程碑。它通過(guò)引入更強(qiáng)大的感知能力和更高的決策透明度,推動(dòng)了自動(dòng)駕駛技術(shù)向更加智能的方向發(fā)展。
2.Senna架構(gòu):Senna采用了獨(dú)特的解耦行為決策-軌跡規(guī)劃思路,利用大規(guī)模駕駛數(shù)據(jù)進(jìn)行微調(diào),以增強(qiáng)對(duì)駕駛場(chǎng)景的理解能力。此外,該架構(gòu)還能通過(guò)自然語(yǔ)言輸出高維決策指令,進(jìn)一步提升了系統(tǒng)的靈活性和適應(yīng)性。
3.商湯絕影DriveAGI:商湯絕影推出的新一代自動(dòng)駕駛大模型DriveAGI,憑借其寬泛適用場(chǎng)景、高性能以及低門(mén)檻的特點(diǎn),成為行業(yè)內(nèi)的一大亮點(diǎn)。該模型特別注重增強(qiáng)端到端自動(dòng)駕駛方案的可解釋性和交互能力
除此以外,我們還可以再加上前文提到的吉利將自身AI模型和deepseek整合得到混合模型。
也許近期就會(huì)出現(xiàn)DeepSeek獨(dú)立的Driving AGI,這些模型在技術(shù)架構(gòu)上都一般包含如下特點(diǎn)作為基礎(chǔ)部件:
1.多模態(tài)數(shù)據(jù)融合:
多模態(tài)大模型能夠處理來(lái)自不同傳感器的數(shù)據(jù),如攝像頭、激光雷達(dá)(LiDAR)、毫米波雷達(dá)等。這些數(shù)據(jù)被整合成一個(gè)統(tǒng)一的表示形式,從而為后續(xù)的決策和規(guī)劃提供全面的信息支持。
2.端到端學(xué)習(xí):
端到端學(xué)習(xí)是指從原始傳感器數(shù)據(jù)直接輸出駕駛指令或軌跡規(guī)劃的過(guò)程。這種方式省去了傳統(tǒng)方法中復(fù)雜的中間步驟,簡(jiǎn)化了系統(tǒng)設(shè)計(jì),并提高了系統(tǒng)的實(shí)時(shí)性和魯棒性。例如,EMMA(End-to-End Multimodal Model for Autonomous Driving)技術(shù)可以直接將原始攝像頭數(shù)據(jù)映射到具體的駕駛動(dòng)作。
3.自然語(yǔ)言處理與交互:
一些先進(jìn)的多模態(tài)大模型不僅限于視覺(jué)信息,還結(jié)合了自然語(yǔ)言處理能力,可以理解并生成人類(lèi)語(yǔ)言描述的駕駛意圖或指令。這使得系統(tǒng)能夠更好地理解和響應(yīng)復(fù)雜環(huán)境中的動(dòng)態(tài)變化,同時(shí)也增強(qiáng)了人機(jī)交互的可能性。
其應(yīng)用場(chǎng)景包括:
1.乘用車(chē)自動(dòng)駕駛:在城市道路、高速公路等多種路況下,多模態(tài)大模型可以幫助車(chē)輛安全地完成變道、避障、停車(chē)等操作。據(jù)報(bào)道,理想汽車(chē)已經(jīng)基于快慢雙系統(tǒng)的思路實(shí)現(xiàn)了量產(chǎn)上車(chē)的應(yīng)用。
2.商用車(chē)及物流配送:商用車(chē)輛和物流配送機(jī)器人不僅可以在NOA模式下使用多模態(tài)大模型實(shí)現(xiàn)L1-L4級(jí)別自駕,特別是在面對(duì)非結(jié)構(gòu)化環(huán)境時(shí),如港口(比如東風(fēng)商用車(chē)和招商集團(tuán)合作的廈門(mén)港、媽灣港無(wú)人集卡)、礦區(qū)(遠(yuǎn)安磷礦地下礦區(qū)自動(dòng)礦車(chē))、工地、倉(cāng)庫(kù)內(nèi)部等特殊場(chǎng)景。這些模型能夠提高運(yùn)輸效率,減少人為干預(yù)的需求,減少司乘人員的精力消耗。
結(jié)語(yǔ)
值得關(guān)注的是,DeepSeek通過(guò)開(kāi)源生態(tài)與高效訓(xùn)練框架,正在打破特斯拉對(duì)端到端技術(shù)的壟斷。其模型支持分布式訓(xùn)練與邊緣計(jì)算部署,即便在國(guó)產(chǎn)芯片上也能實(shí)現(xiàn)低延遲推理。隨著蒸餾技術(shù)的進(jìn)一步優(yōu)化,未來(lái)車(chē)載模型的體積與能耗有望再降,為L(zhǎng)4級(jí)自動(dòng)駕駛的規(guī);涞劁伷降缆。
從開(kāi)源賦能到蒸餾提效,再到端到端重構(gòu)駕駛邏輯,DeepSeek正在以“技術(shù)普惠”的姿態(tài)重塑?chē)?guó)內(nèi)智能汽車(chē)行業(yè)。在這場(chǎng)變革中,車(chē)企借助AI大模型的“智力杠桿”,實(shí)現(xiàn)安全、高效與人性化駕駛體驗(yàn)的全面升級(jí)。當(dāng)DeepSeek的“類(lèi)腦思考”真正融入車(chē)輪之上,中國(guó)智能汽車(chē)產(chǎn)業(yè)的全球領(lǐng)導(dǎo)地位或?qū)⒉辉龠b遠(yuǎn)。
免責(zé)聲明:
凡本公眾號(hào)注明“來(lái)源:XXX(非智車(chē)科技)”的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞和分享更多信息,并不代表本平臺(tái)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),版權(quán)歸原作者所有,如有侵權(quán)請(qǐng)聯(lián)系我們刪除。
原文標(biāo)題 : 端到端類(lèi)腦自動(dòng)駕駛 | DeepSeek如何影響國(guó)內(nèi)智能汽車(chē)行業(yè)

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
6月20日立即下載>> 【白皮書(shū)】精準(zhǔn)測(cè)量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車(chē)生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
推薦專(zhuān)題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語(yǔ)權(quán)
- 3 深度報(bào)告|中國(guó)AI產(chǎn)業(yè)正在崛起成全球力量,市場(chǎng)潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級(jí)獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷(xiāo)中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰(shuí)在領(lǐng)跑?
- 9 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過(guò)于簡(jiǎn)單
- 10 “搶灘”家用機(jī)器人領(lǐng)域,聯(lián)通、海爾、美的等紛紛入局