本書對視頻處理與分析領域的理論基礎、關鍵技術和評估應用進行系統(tǒng)而深入的介紹。全書分為8章,首先對視頻處理與分析的基本概念和相關視覺認知基本理論進行介紹,然后對視頻處理中的目標識別和分類、目標檢測、目標分割、目標跟蹤、視頻語義理解等核心視覺任務及其關鍵技術方法進行梳理和總結,并對視頻分析應用情況進行介紹。本書聚焦領域研究核心問題,以技術發(fā)展為主線,側重理論方法與實際應用的有機結合,力求使讀者能快速掌握和應用視頻處理與分析的理論、方法和技術。
更多科學出版社服務,請掃碼獲取。
國家863計劃“多特征融合的視頻目標跟蹤關鍵技術”,編號09H1041M91,負責人
目錄
“新一代人工智能理論、技術及應用叢書”序
前言
第1章 緒論 1
1.1 背景介紹 1
1.2 基本概念 2
1.3 任務與挑戰(zhàn) 3
第2章 目標識別和分類 5
2.1 引言 5
2.1.1 基本理論 5
2.1.2 問題與挑戰(zhàn) 9
2.2 經(jīng)典目標識別和分類方法 10
2.2.1 傳統(tǒng)目標分類方法 11
2.2.2 基于深度學習的目標分類模型 16
2.2.3 目標分類模型的發(fā)展方向 23
2.3 小樣本目標識別 25
2.3.1 問題介紹 26
2.3.2 代表性方法 27
2.4 RGB-D目標識別 28
2.4.1 問題介紹 28
2.4.2 代表性方法 29
2.5 細粒度目標識別 30
2.5.1 問題介紹 30
2.5.2 代表性方法 31
2.6 小結 33
參考文獻 33
第3章 目標檢測 39
3.1 引言 39
3.1.1 目標檢測的定義與挑戰(zhàn) 39
3.1.2 發(fā)展歷程 39
3.2 經(jīng)典目標檢測 41
3.2.1 傳統(tǒng)目標檢測 41
3.2.2 基于深度學習的目標檢測 42
3.3 不同監(jiān)督信息下的目標檢測 49
3.3.1 充分監(jiān)督下的目標檢測 49
3.3.2 弱監(jiān)督目標檢測 49
3.3.3 基于混合監(jiān)督的目標檢測 51
3.4 基于視頻的目標檢測 54
3.4.1 高精度的視頻目標檢測 54
3.4.2 高速視頻目標檢測 59
3.5 小結 61
參考文獻 61
第4章 目標分割 65
4.1 引言 65
4.1.1 基本概念 65
4.1.2 問題與挑戰(zhàn) 66
4.2 二值化分割 66
4.2.1 傳統(tǒng)二值化分割方法 67
4.2.2 基于深度學習的二值化分割 68
4.3 語義分割 70
4.3.1 基于全卷積神經(jīng)網(wǎng)絡的語義分割 71
4.3.2 基于編-解碼結構的語義分割 72
4.3.3 基于神經(jīng)網(wǎng)絡結構搜索的語義分割 74
4.3.4 基于上下文學習的語義分割 76
4.3.5 弱監(jiān)督語義分割 79
4.4 實例分割 81
4.4.1 基于分割模型的實例分割 81
4.4.2 基于兩階段檢測模型的實例分割 82
4.4.3 基于單階段檢測模型的實例分割 83
4.4.4 基于動態(tài)網(wǎng)絡的實例分割 84
4.5 全景分割模型 85
4.6 小結 87
參考文獻 87
第5章 目標跟蹤 93
5.1 引言 93
5.1.1 基本概念介紹 93
5.1.2 任務、問題與挑戰(zhàn) 94
5.2 單攝像機單目標跟蹤 95
5.2.1 傳統(tǒng)單目標跟蹤方法 96
5.2.2 基于深度學習的單目標跟蹤 104
5.3 單攝像機多目標跟蹤 110
5.3.1 離線跟蹤方法 111
5.3.2 在線跟蹤方法 113
5.4 多攝像機目標跟蹤 115
5.4.1 重疊場景多攝像機目標跟蹤 116
5.4.2 非重疊場景多攝像機目標跟蹤 118
5.5 小結 123
參考文獻 124
第6章 視頻語義理解 129
6.1 引言 129
6.2 人體行為識別 130
6.2.1 人體行為識別簡介 130
6.2.2 代表性方法介紹 130
6.3 群體行為分析 132
6.3.1 群體行為分析簡介 132
6.3.2 代表性方法介紹 133
6.4 異常行為檢測 137
6.4.1 異常行為檢測簡介 137
6.4.2 代表性方法介紹 138
6.5 視頻描述和視頻問答 141
6.5.1 視頻描述 141
6.5.2 視頻問答 144
6.6 小結 146
參考文獻 146
第7章 視頻分析評估與評測 151
7.1 常用數(shù)據(jù)集 151
7.1.1 目標識別和分類 151
7.1.2 目標檢測和定位 153
7.1.3 目標分割 154
7.1.4 視頻目標跟蹤 155
7.2 評價指標 160
7.2.1 目標分類 160
7.2.2 目標檢測和定位 161
7.2.3 目標分割 162
7.2.4 視頻目標跟蹤 164
7.2.5 視頻語義理解 166
7.3 視覺圖靈評估評測 168
7.3.1 簡介 168
7.3.2 視覺圖靈評估評測 168
7.4 小結 172
參考文獻 172
第8章 視頻分析應用 179
8.1 視頻分析應用領域 179
8.1.1 安全領域 179
8.1.2 交通領域 180
8.1.3 娛樂領域 181
8.1.4 生活領域 181
8.1.5 其他領域 182
8.2 面向安全的智能視頻分析應用 183
8.2.1 應用背景 183
8.2.2 應用系統(tǒng) 185
8.2.3 應用關鍵技術 186
8.2.4 應用示例 187
8.3 小結 190
參考文獻 190