中圖網(wǎng)

>

汽車與交通運(yùn)輸

>

汽車

(精裝)智能車輛強(qiáng)化學(xué)習(xí)與決策控制技術(shù)

包郵 (精裝)智能車輛強(qiáng)化學(xué)習(xí)與決策控制技術(shù)

作者：呂超龔建偉龔乘

出版社：北京理工大學(xué)出版社出版時(shí)間：2024-05-01

開本： 16開

本類榜單：工業(yè)技術(shù)銷量榜

中圖價(jià):¥41.7(5.6折) 定價(jià) ~~¥74.0~~ 登錄后可看到會(huì)員價(jià)

加入購物車收藏

開年大促， 全場(chǎng)包郵

?新疆、西藏除外

本類五星書更多>

>
公路車寶典(ZINN的公路車維修與保養(yǎng)秘籍)

公路車寶典(ZINN的公路車維修與保養(yǎng)秘籍)

¥69.6¥120
>
晶體管電路設(shè)計(jì)(下)

晶體管電路設(shè)計(jì)(下)

¥25.7¥38
>
基于個(gè)性化設(shè)計(jì)策略的智能交通系統(tǒng)關(guān)鍵技術(shù)

基于個(gè)性化設(shè)計(jì)策略的智能交通系統(tǒng)關(guān)鍵技術(shù)

¥34.3¥68
>
花樣百出:貴州少數(shù)民族圖案填色

花樣百出:貴州少數(shù)民族圖案填色

¥17.2¥45
>
山東教育出版社有限公司技術(shù)轉(zhuǎn)移與技術(shù)創(chuàng)新歷史叢書中國高等技術(shù)教育的蘇化(1949—1961)以北京地區(qū)為中心

山東教育出版社有限公司技術(shù)轉(zhuǎn)移與技術(shù)創(chuàng)新歷史叢書中國高等技術(shù)教育的蘇化(1949—1961)以北京地區(qū)為中心

¥12.7¥39
>
鐵路機(jī)車概要.交流傳動(dòng)內(nèi)燃.電力機(jī)車

鐵路機(jī)車概要.交流傳動(dòng)內(nèi)燃.電力機(jī)車

¥158.4¥198
>
利維坦的道德困境:早期現(xiàn)代政治哲學(xué)的問題與脈絡(luò)

利維坦的道德困境:早期現(xiàn)代政治哲學(xué)的問題與脈絡(luò)

¥31.9¥49

商品詳情
商品評(píng)論(0條)

中圖價(jià):¥41.7 加入購物車

版權(quán)信息
內(nèi)容簡(jiǎn)介
目錄

(精裝)智能車輛強(qiáng)化學(xué)習(xí)與決策控制技術(shù) 版權(quán)信息

ISBN：9787576341041
條形碼：9787576341041 ; 978-7-5763-4104-1
裝幀：平裝-膠訂
冊(cè)數(shù)：暫無
重量：暫無
所屬分類：
工業(yè)技術(shù)
>
汽車與交通運(yùn)輸
>
汽車

(精裝)智能車輛強(qiáng)化學(xué)習(xí)與決策控制技術(shù) 內(nèi)容簡(jiǎn)介

強(qiáng)化學(xué)習(xí)是人工智能領(lǐng)域近年來崛起的新興技術(shù)，在機(jī)器人、圖像識(shí)別、語音識(shí)別等多個(gè)領(lǐng)域有著重要應(yīng)用，而自主行為決策則是車輛智能化的重要體現(xiàn)。本書將二者結(jié)合起來，從數(shù)據(jù)采集、模型構(gòu)建、模型驗(yàn)證等角度系統(tǒng)性地闡述了一系列基于強(qiáng)化學(xué)習(xí)的行為決策方法。全書共7章，第1,2章介紹了智能車輛系統(tǒng)的基本構(gòu)成，以及強(qiáng)化學(xué)習(xí)技術(shù)的基礎(chǔ)知識(shí)；第3至6章基于不同強(qiáng)化學(xué)習(xí)的特點(diǎn)，詳細(xì)闡述了經(jīng)典強(qiáng)化學(xué)習(xí)、深度強(qiáng)化學(xué)習(xí)、逆強(qiáng)化學(xué)習(xí)和分層強(qiáng)化學(xué)習(xí)在智能車行為決策系統(tǒng)構(gòu)建中的應(yīng)用，以及如何測(cè)試這些系統(tǒng)；第7章則從更宏觀的角度探討了目前強(qiáng)化學(xué)習(xí)方法在遷移和泛化方面的缺陷，并介紹了一種可遷移的強(qiáng)化學(xué)習(xí)決策方法。

書中涉及的所有模型和數(shù)據(jù)均來自于作者團(tuán)隊(duì)的研究成果，每一章都有相關(guān)的引申閱讀材料，可供讀者參考。

本書可作為智能交通系統(tǒng)、智能車輛、地面無人車輛及移動(dòng)機(jī)器人等相關(guān)專業(yè)高年級(jí)本科生和研究生的教學(xué)資料，也可以作為從事智能決策與控制技術(shù)領(lǐng)域研究的科研技術(shù)人員的參考資料。

(精裝)智能車輛強(qiáng)化學(xué)習(xí)與決策控制技術(shù) 目錄

第1章智能車輛系統(tǒng)概述………………………………………………………001

1.1 智能車輛介紹…………………………………………………………003

1.1.1 智能車輛架構(gòu) …………………………………………………003

1.1.2 智能車輛發(fā)展摘記 ……………………………………………006

1.2 智能車輛的基本組成部分……………………………………………017

1.2.1 環(huán)境感知與場(chǎng)景理解模塊…………………………………017

1.2.2 決策控制模塊 …………………………………………………021

第2章強(qiáng)化學(xué)習(xí)基礎(chǔ)……………………………………………………………025

2.1 強(qiáng)化學(xué)習(xí)概述 …………………………………………………………027

2.1.1 強(qiáng)化學(xué)習(xí)的特點(diǎn) ……………………………………………………028

2.1.2 強(qiáng)化學(xué)習(xí)的發(fā)展歷史 …………………………………………028

2.2 馬爾可夫決策過程 ……………………………………………………030

2.2.1 馬爾可夫過程 …………………………………………………031

2.2.2 馬爾可夫決策過程分析 ………………………………………033

2.2.3 貝爾曼方程 …………………………………………………………034

2.3 Q迭代與Q學(xué)習(xí)………………………………………………………038

2.3.1 Q迭代…………………………………………………………040

2.3.2 時(shí)序差分算法 …………………………………………………044

2.3.3Q學(xué)習(xí)………………………………………………………………045

2.4 函數(shù)逼近 ……………………………………………………………………049

2.4.1 函數(shù)逼近方法 …………………………………………………049

2.4.2 值函數(shù)逼近 ……………………………………………………051

2.5 深度強(qiáng)化學(xué)習(xí)…………………………………………………………055

2.5.1 深度強(qiáng)化學(xué)習(xí)原理 ……………………………………………055

2.5.2 深度Q網(wǎng)絡(luò)……………………………………………………057

第3章基于經(jīng)典強(qiáng)化學(xué)習(xí)的決策控制技術(shù) ……………………………………061

3.1 CARLA仿真平臺(tái)介紹 …………………………………………………063

3.2 基于Q學(xué)習(xí)的決策控制……………………………………………064

3.2.1 縱向決策控制 …………………………………………………064

3.2.2 橫向決策控制 …………………………………………………067

3.2.3 路徑跟蹤 …………………………………………………………069

3.2.4 學(xué)習(xí)人類駕駛員………………………………………………071

3.3 基于NQL的速度控制 …………………………………………………074

3.3.1 NQL原理 ……………………………………………………………076

3.3.2 NQL模型構(gòu)建………………………………………………078

3.3.3 NQL方法測(cè)試 ……………………………………………………084

第4章基于分層強(qiáng)化學(xué)習(xí)的決策控制技術(shù) ……………………………………108

4.1 分層強(qiáng)化學(xué)習(xí)方法及原理……………………………………………109

4.1.1 半馬爾可夫決策過程 …………………………………………109

4.1.2 分層強(qiáng)化學(xué)習(xí)原理概述………………………………………111

4.2 基于分層強(qiáng)化學(xué)習(xí)的自主超車決策方法 …………………………111

4.2.1 基于半馬爾可夫決策過程和運(yùn)動(dòng)基元的超車決策

模塊…113

4.2.2 基于馬爾可夫決策過程和社會(huì)偏好的超車決策模塊 …121

4.3 基于半馬爾可夫決策過程和運(yùn)動(dòng)基元的超車決策模塊仿真

實(shí)驗(yàn) …………………………………………………………………………124

4.3.1 離線運(yùn)動(dòng)基元提取結(jié)果………………………………………124

4.3.2 超車決策模塊實(shí)驗(yàn)結(jié)果及分析 …………………………125

4.4 基于馬爾可夫決策過程和社會(huì)偏好的超車決策模塊實(shí)車

實(shí)驗(yàn) …………………………………………………………………………………127

4.4.1 基于智能駕駛平臺(tái)的實(shí)車數(shù)據(jù)采集及預(yù)處理……………127

4.4.2 超車決策模塊實(shí)驗(yàn)……………………………………………137

第5章基于深度強(qiáng)化學(xué)習(xí)的決策控制技術(shù) ……………………………………141

5.1 基于DQN的超車場(chǎng)景決策控制模型構(gòu)建………………………142

5.2 基于 DQN的超車決策實(shí)驗(yàn)……………………………………………143

5.3 基于DDPG交叉路口的縱向決策控制模型構(gòu)建 …………………145

5.3.1 DDPG算法原理…………………………………………………145

5.3.2 縱向決策問題建模 ……………………………………………148

5.3.3 基元庫構(gòu)建與運(yùn)動(dòng)基元自主學(xué)習(xí)…………………………150

5.3.4 基于基元庫的*優(yōu)基元選擇 …………………………………154

5.4 交叉路口場(chǎng)景下的縱向決策控制仿真實(shí)驗(yàn)………………………157

5.4.1 交叉路口場(chǎng)景簡(jiǎn)述……………………………………………157

5.4.2 離線學(xué)習(xí)與測(cè)試……………………………………………………158

5.4.3 對(duì)比實(shí)驗(yàn)結(jié)果與分析 …………………………………………159

5.5 交叉路口場(chǎng)景下的縱向決策控制實(shí)車實(shí)驗(yàn) ………………………163

5.5.1 交叉路口下實(shí)車數(shù)據(jù)采集與處理…………………………163

5.5.2 實(shí)車數(shù)據(jù)驅(qū)動(dòng)的交叉路口實(shí)驗(yàn)場(chǎng)景…………………………163

5.6 對(duì)比實(shí)驗(yàn)結(jié)果與分析…………………………………………………166

5.6.1 子任務(wù)離線學(xué)習(xí)任務(wù) …………………………………………166

5.6.2 測(cè)試階段 ………………………………………………………………173

第6章決策的遷移與泛化………………………………………………………177

6.1 遷移學(xué)習(xí)與認(rèn)知地圖…………………………………………………178

6.2 基于SR的決策遷移建模……………………………………………179

6.2.1 類人換道場(chǎng)景表征……………………………………………180

6.2.2 基于SR的分層強(qiáng)化學(xué)習(xí)換道決策 ………………………185

6.2.3 換道場(chǎng)景運(yùn)動(dòng)基元 ……………………………………………188

6.2.4 基于場(chǎng)景表征和運(yùn)動(dòng)基元的運(yùn)動(dòng)規(guī)劃……………………190

6.3 類人可遷移換道模型的可遷移超車實(shí)驗(yàn)測(cè)試……………………191

6.3.1 面向超車類人換道場(chǎng)景表征的離線構(gòu)建…………………191

6.3.2 自主換道超車實(shí)驗(yàn)與結(jié)果分析………………………………193

6.4 類人可遷移換道模型的類人實(shí)驗(yàn)測(cè)試 ……………………………196

6.4.1 不同風(fēng)格行為的類人換道場(chǎng)景表征 ………………………196

6.4.2 類人換道運(yùn)動(dòng)規(guī)劃實(shí)驗(yàn)結(jié)果及分析………………………198

6.4.3 類人換道決策實(shí)驗(yàn)結(jié)果及分析………………………………202

參考文獻(xiàn) ……………………………………………………………………………………206

術(shù)語表………………………………………………………………………………212

索引…………………………………………………………………………………………214

展開全部

商品評(píng)論(0條)

寫書評(píng) 賺書幣

暫無評(píng)論……

書友推薦

>
詩經(jīng)-先民的歌唱
詩經(jīng)-先民的歌唱
裴溥言
¥14.5~~¥39.8~~
>
二體千字文
二體千字文
本書編委會(huì)
¥14.0~~¥40.0~~
>
苦雨齋序跋文-周作人自編集
苦雨齋序跋文-周作人自編集
周作人著，止庵校訂
¥6.1~~¥16.0~~
>
伊索寓言-世界文學(xué)名著典藏-全譯本
伊索寓言-世界文學(xué)名著典藏-全譯本
[古希臘] 伊索著，陳韻如譯
¥6.7~~¥19.0~~
>
月亮與六便士
月亮與六便士
毛姆
¥19.1~~¥42.0~~
>
回憶愛瑪儂
回憶愛瑪儂
[日]梶尾真治著，王瑋譯
¥24.0~~¥32.8~~
>
月亮虎
月亮虎
[英] 佩內(nèi)洛普·萊夫利著，郭國良譯
¥16.4~~¥48.0~~
>
我與地壇
我與地壇
史鐵生
¥16.4~~¥28.0~~

本類暢銷

汽車認(rèn)識(shí)

蔡昶文

¥33.3~~¥38~~
用思維導(dǎo)圖學(xué)汽車示波器的使用

楊增雨主編

¥81.4~~¥138~~
汽車機(jī)械制圖

馬英，張莉萍主編

¥20.2~~¥32~~
不良情緒應(yīng)急處理包--孤獨(dú)感

中圖網(wǎng)

¥12.9~~¥30~~
不良情緒應(yīng)急處理包--精神內(nèi)耗

中圖網(wǎng)

¥12.9~~¥30~~
孩子、家庭和外部世界

唐納德·溫尼科特

¥17.8~~¥56~~

中图网(原中国图书网)：网上书店，尾货特色书店，30万种特价书低至2折！

包郵 (精裝)智能車輛強(qiáng)化學(xué)習(xí)與決策控制技術(shù)

(精裝)智能車輛強(qiáng)化學(xué)習(xí)與決策控制技術(shù) 版權(quán)信息

(精裝)智能車輛強(qiáng)化學(xué)習(xí)與決策控制技術(shù) 內(nèi)容簡(jiǎn)介

(精裝)智能車輛強(qiáng)化學(xué)習(xí)與決策控制技術(shù) 目錄

詩經(jīng)-先民的歌唱

二體千字文

苦雨齋序跋文-周作人自編集

伊索寓言-世界文學(xué)名著典藏-全譯本

月亮與六便士

回憶愛瑪儂

月亮虎

我與地壇

汽車認(rèn)識(shí)

用思維導(dǎo)圖學(xué)汽車示波器的使用

汽車機(jī)械制圖

不良情緒應(yīng)急處理包--孤獨(dú)感

不良情緒應(yīng)急處理包--精神內(nèi)耗

孩子、家庭和外部世界

百年夢(mèng)憶:梁實(shí)秋人生自述

俄羅斯書簡(jiǎn)

連科六短篇-短篇經(jīng)典文庫

女孩們

陶潛和櫻子

趙元任早年自傳