美國國家工程院院士、福特技術(shù)研究員 Dimitar Filev : 用于智慧出行的智能車輛系統(tǒng)
這些系統(tǒng)已經(jīng)非常智能,但我們在此基礎(chǔ)上設(shè)計了智能用戶界面讓車輛更加定制化以適應(yīng)不同的用戶。虛擬駕駛系統(tǒng)與交通移動云連接,控制著車輛。因此,定制化和智能化是自動駕駛車輛發(fā)展的兩個方向。
接下來討論幾個駕駛汽車中的應(yīng)用以及福特在自動駕駛中的研究。在汽車控制中有自動動力系統(tǒng)控制、自動轉(zhuǎn)向控制和半自主懸架系統(tǒng)這些不同的系統(tǒng)經(jīng)過標(biāo)定可以實(shí)現(xiàn)舒適、常規(guī)和運(yùn)動三種模式之間的切換。
車輛模式的選擇共有27中組合,讓駕駛員在這之間進(jìn)行選擇是一件困難的事,而智能系統(tǒng)則可以基于道路特點(diǎn)和駕駛員的反應(yīng)選擇最優(yōu)的模式,這也是定制化的一個方面。另一個重要的應(yīng)用是智能巡航控制,它基于速度曲線尋找最優(yōu)的巡航速度設(shè)置點(diǎn)來達(dá)到最優(yōu)化燃油消耗的目標(biāo)。
通過對數(shù)字地圖的分析、交通標(biāo)志的識別、道路幾何形狀的辨別系統(tǒng)能夠?yàn)轳{駛者建議最優(yōu)的加減速、檔位,提供最高效的駕駛模式選擇。
此外,分析駕駛員的行為由此生成評估報告、根據(jù)車輛在不同時間頻繁的行車、停車的記錄可以估計出下一個目的地。
福特在自動駕駛領(lǐng)域的布置和發(fā)展包括投資了 Argo AI 以及成立了自動駕駛子公司AV LLC,這兩家由福特所有的獨(dú)立實(shí)體計劃在2021年前完成研發(fā)并投入生產(chǎn)。
福特研究自動駕駛采用的是分層級的方法,層級從反射級 Reflexive 到深思級 Reflective。反射級指的是當(dāng)人們在駕駛時不需要思考而下意識作出的一些舉動,Reflective 則是完全相反的,比如人在高速駕駛的時候會不斷地思考獲取最佳的決策。
分層級方法有三個層級,Decision Making 曾屬于高層規(guī)劃,基于強(qiáng)化學(xué)習(xí)、博弈論方法;稍低一個層級的 Path Planning主要完成避障等場景;沿著規(guī)定好的軌跡行駛則是由最后的 Path Following層級使用模型預(yù)測控制完成。
Path Planning 部分使用的是Q強(qiáng)化學(xué)習(xí)方法,強(qiáng)化學(xué)習(xí)通過最大化累計收益函數(shù)Q函數(shù)來獲得最佳決策,此處狀態(tài)為車輛本身以及相鄰車輛的實(shí)時的橫向和縱向位置,行為是車道保持、巡航速度增減以及左右換道。仿真器用來訓(xùn)練神經(jīng)網(wǎng)絡(luò)擬合決策Q函數(shù),該算法提供了狀態(tài)到行動的映射,得到的是貝爾曼方程的實(shí)時解。
強(qiáng)化學(xué)習(xí)近些年變得很火熱尤其是谷歌的 Deepmind 推出了AlphaGo取得了成功,他們提出了 Deep Q Learning(DQN),現(xiàn)在幾乎成了強(qiáng)化學(xué)習(xí)的標(biāo)準(zhǔn)。在DQN算法中,我們建立了一個人工目標(biāo)于是得到:
y與Q的差值可類比監(jiān)督學(xué)習(xí)中的預(yù)測值與標(biāo)簽的差值,由此得到的時域差用來更新網(wǎng)絡(luò)得到最優(yōu)值。在此基礎(chǔ)上,Deepmind提出了三個主要的改進(jìn)形成了double DQN,首先是提出適合多層神經(jīng)網(wǎng)絡(luò)的Q函數(shù);第二他們提出一個采樣任意的minibatch的方式處理訓(xùn)練網(wǎng)絡(luò)的數(shù)據(jù);第三個則是他們提出了兩個Q函數(shù)分別為當(dāng)前Q函數(shù)和目標(biāo)Q函數(shù)來更新網(wǎng)絡(luò),這些改進(jìn)使得強(qiáng)化學(xué)習(xí)更加穩(wěn)定。
然而,當(dāng)福特直接使用這些方法是發(fā)現(xiàn)訓(xùn)練神經(jīng)網(wǎng)絡(luò)經(jīng)常容易失敗并且訓(xùn)練速度很慢。因此他們加入了一些常識性的規(guī)則,當(dāng)發(fā)現(xiàn)行為不安全時,將安全的行為加入網(wǎng)絡(luò),對碰撞的判別會混合到采樣隨機(jī)minibatch中用于網(wǎng)絡(luò)的更新,最終結(jié)果取得顯著性效果。
在強(qiáng)化學(xué)習(xí)中,應(yīng)該不僅僅依賴于對數(shù)據(jù)這些短期性的經(jīng)驗(yàn)的學(xué)習(xí),一些常識性的長期經(jīng)驗(yàn)規(guī)則的使用也很重要。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
6月20日立即下載>> 【白皮書】精準(zhǔn)測量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報名>> 【在線會議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7.30-8.1火熱報名中>> 全數(shù)會2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動力電池技術(shù)應(yīng)用大會
-
免費(fèi)參會立即報名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
推薦專題
-
10 中東AI迷霧里的中美棋局
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 一文看懂視覺語言動作模型(VLA)及其應(yīng)用
- 4 深度報告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 5 上海跑出80億超級獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 6 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 7 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 8 百億AI芯片訂單,瘋狂傾銷中東?
- 9 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領(lǐng)跑?
- 10 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過于簡單