本書詳細闡述了深海智能探測與自主采樣機器人的兩層分離式主體結構總體設計、關鍵配套部件及應用系統(tǒng)的創(chuàng)新設計。本書建立了海底熱液異常源信息智能搜索的強化學習模型,提出了機器學習系列高效求解算法,提高了深海探測與采樣機器人的搜索效率與準確性;建立了深海探測與采樣機器人實時跟蹤控制的強化學習模型,提出了深度學習系列高效求解方法,實現(xiàn)了深海探測與采樣機器人運動軌跡的精確跟蹤與自主精準采樣。本書闡述的深海探測與采樣機器人具有整機智能和多功能等顯著特點,其智能搜索、軌跡跟蹤智能控制、自主精準地質采樣等先進性能在大洋航次調查任務中得到了驗證。
更多科學出版社服務,請掃碼獲取。
分布式協(xié)同控制及優(yōu)化理論方法,中國自動化學會自然科學一等獎,2021年
目錄
“新一代人工智能理論、技術及應用叢書”序
前言
第1章 深海探測與采樣機器人概述 1
1.1 科學與應用需求 1
1.2 系統(tǒng)功能定位 5
1.2.1 深海拖曳系統(tǒng) 5
1.2.2 海底電視抓斗 6
1.2.3 深海遙控潛水器 7
1.2.4 現(xiàn)有深海調查作業(yè)設備的優(yōu)勢與局限性 9
1.2.5 深海探測與采樣機器人產生背景 10
1.3 系統(tǒng)概述與海試應用 11
第2章 深海探測與采樣機器人總體設計 12
2.1 總體設計需求 12
2.2 總體結構與優(yōu)化布局 13
2.2.1 上層模塊總體布局 14
2.2.2 下層模塊總體布局 16
2.2.3 總體布局與重量重心估算 17
2.3 關鍵零部件研制 19
2.4 艙外搭載主要設備 31
2.5 主要技術性能與技術指標 36
2.5.1 主要技術性能 36
2.5.2 主要技術指標與先進性分析 36
第3章 深海探測與采樣機器人系統(tǒng)設計 39
3.1 系統(tǒng)設計需求 39
3.2 船載配電系統(tǒng) 40
3.2.1 臍帶纜的適配性 41
3.2.2 系統(tǒng)配電方案 44
3.2.3 水面監(jiān)控動力站 47
3.3 綜合監(jiān)控系統(tǒng) 48
3.3.1 綜合監(jiān)控系統(tǒng)概述 48
3.3.2 綜合布線系統(tǒng) 53
3.3.3 信息傳輸系統(tǒng) 54
3.3.4 絕緣檢測 55
3.4 數(shù)據(jù)管理與信息集成模塊 56
3.4.1 模塊概述 56
3.4.2 綜合監(jiān)控系統(tǒng)軟件 57
3.4.3 基于分層結構的交互式運動控制系統(tǒng)設計 59
第4章 深海探測與采樣機器人作業(yè)模塊 62
4.1 作業(yè)模塊需求分析 62
4.1.1 深海作業(yè)工況分析 62
4.1.2 關鍵技術指標分析 63
4.2 抓斗總體設計 64
4.2.1 抓斗模塊設計 64
4.2.2 下層框架設計 67
4.2.3 上下兩層框架連接處設計 68
4.3 抓斗結構優(yōu)化與仿真 70
4.3.1 抓斗結構優(yōu)化 70
4.3.2 抓斗模型仿真校驗 74
4.4 抓斗制造工藝 77
4.4.1 主要配合工藝 78
4.4.2 焊接工藝設計 78
4.4.3 表面處理工藝分析 79
4.5 抓斗模塊實驗測試 79
4.5.1 抓斗咬合力測試 79
4.5.2 抓斗最大應力應變測量 81
4.5.3 實驗誤差分析及驗證 82
4.6 機械手系統(tǒng) 84
4.6.1 機械手組成 84
4.6.2 機械手指標 85
4.6.3 機械手作用空間 85
4.6.4 液壓參數(shù)及接口 89
4.6.5 閥控系統(tǒng) 89
第5章 深海機器人海底目標智能搜索方法 92
5.1 海底目標搜索研究概況 92
5.1.1 基于梯度場的信號源極值搜索方法 95
5.1.2 基于搜索行為的信號源搜索方法 95
5.1.3 基于模型逼近的信號源搜索方法 96
5.1.4 基于多模態(tài)傳感器的信號源搜索方法 97
5.1.5 面向信號源搜索的深度強化學習方法 98
5.2 基于場強在線估計的深海機器人智能搜索方法 98
5.2.1 基于極限學習機的場強在線估計 99
5.2.2 場源搜索路徑規(guī)劃 107
5.2.3 路徑點跟蹤控制及完整的場源搜索算法 108
5.2.4 實驗結果及分析 109
5.3 基于強化學習的深海熱液羽狀流跟蹤方法 113
5.3.1 羽狀流追蹤問題的確定性策略梯度強化學習算法 114
5.3.2 羽狀流追蹤問題的遞歸神經網(wǎng)絡強化學習算法 118
5.3.3 稀疏環(huán)境反饋下基于自注意力機制的強化學習算法 122
5.3.4 基于部分可觀測馬爾可夫決策過程的強化學習算法 125
5.4 基于周期擾動極值搜索的三維場源搜索方法 137
5.4.1 問題描述 137
5.4.2 周期擾動極值搜索方法 139
5.4.3 控制策略 141
5.4.4 穩(wěn)定性證明 142
5.4.5 仿真實驗 155
第6章 深海機器人海底作業(yè)智能控制方法 160
6.1 海底作業(yè)智能控制研究概況 160
6.2 動力學與運動學建模 163
6.2.1 深海機器人的六自由度運動學與動力學模型 164
6.2.2 深海機器人水平面運動模型 167
6.3 基于非線性模型預測控制的路徑點追蹤方法 169
6.3.1 問題描述 169
6.3.2 視線導航策略及其改進表示 170
6.3.3 模型預測控制算法 172
6.3.4 仿真實驗結果與分析 177
6.4 基于確定性策略梯度的強化學習深度控制方法 179
6.4.1 問題描述 180
6.4.2 馬爾可夫決策過程建模 181
6.4.3 基于神經網(wǎng)絡的確定性策略梯度算法 184
6.4.4 仿真實驗結果與分析 193
6.5 基于分層強化學習的長時間跨度路徑點跟蹤控制 200
6.5.1 問題描述 201
6.5.2 分層馬爾可夫決策過程建模 203
6.5.3 分層確定性策略梯度算法 208
6.5.4 仿真實驗結果與分析 211
6.6 基于元強化學習的軌跡跟蹤控制 216
6.6.1 問題描述 216
6.6.2 元強化學習馬爾可夫決策過程建模 219
6.6.3 基于注意力機制的元強化學習控制算法 222
6.6.4 深海機器人仿真環(huán)境搭建 229
6.6.5 仿真結果實驗與分析 233
第7章 深海探測與采樣機器人水下試驗 240
7.1 水池試驗 240
7.2 深海試驗 243
7.2.1 海試方案 244
7.2.2 碼頭測試 247
7.2.3 作業(yè)過程 248
7.2.4 結果分析 251
7.2.5 海試總結 255
參考文獻 256