定 價(jià):59 元
叢書名:科學(xué)出版社"十四五"普通高等教育本科規(guī)劃教材
當(dāng)前圖書已被 10 所學(xué)校薦購過!
查看明細(xì)
- 作者:劉剛
- 出版時(shí)間:2023/10/1
- ISBN:9787030764225
- 出 版 社:科學(xué)出版社
- 中圖法分類:TP391
- 頁碼:268
- 紙張:
- 版次:31
- 開本:16
自然語言處理是一門集語言學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)于一體的科學(xué),它包含很廣泛的內(nèi)容,根據(jù)其應(yīng)用目的不同,所采用的技術(shù)手段也不盡相同。本書從數(shù)理基礎(chǔ)到模型介紹,再到生活應(yīng)用,從不同的層次,由淺入深、循序漸進(jìn)地展示一個(gè)完整的自然語言處理學(xué)習(xí)體系。《BR》本書分兩部分。第一部分為理論基礎(chǔ),其中第1~4章對(duì)什么是自然語言處理、當(dāng)前主流的自然語言處理技術(shù),以及目前自然語言處理遇到的困境進(jìn)行介紹;第5、6章從數(shù)學(xué)基礎(chǔ)、語言模型,以及詞法分析、語義分析等方面介紹自然語言處理的底層邏輯和模型原理。第二部分為實(shí)踐應(yīng)用,第7~11章介紹自然語言處理在生活中的應(yīng)用!禕R》本書實(shí)用性強(qiáng)、案例貼近生活,每章配有習(xí)題及其答案,讀者可以掃描二維碼查看習(xí)題答案。
更多科學(xué)出版社服務(wù),請(qǐng)掃碼獲取。
目錄
第一部分 理論基礎(chǔ)
第1章 緒論 1
1.1 基本概念 1
1.2 自然語言處理的產(chǎn)生與發(fā)展 2
1.3 基本問題和主要困難 3
1.3.1 自然語言處理的基本問題 3
1.3.2 自然語言處理面對(duì)的主要困難 4
1.4 深度學(xué)習(xí)在自然語言處理中的應(yīng)用 5
1.4.1 深度學(xué)習(xí)概述 5
1.4.2 面向自然語言處理的深度學(xué)習(xí)方法 5
1.4.3 目前深度學(xué)習(xí)應(yīng)用存在的局限及展望 6
1.5 本章小結(jié) 7
習(xí)題1 7
第2章 數(shù)學(xué)基礎(chǔ) 8
2.1 概率論基礎(chǔ) 8
2.1.1 樣本空間和概率 8
2.1.2 隨機(jī)變量 9
2.1.3 條件概率公式、全概率公式和貝葉斯公式 10
2.1.4 期望和方差 11
2.2 信息論基礎(chǔ) 11
2.2.1 自信息和熵 12
2.2.2 聯(lián)合熵和條件熵 13
2.2.3 互信息、相對(duì)熵和交叉熵 14
2.2.4 困惑度 14
2.2.5 噪聲信道模型 15
2.3 深度學(xué)習(xí)的數(shù)學(xué)基礎(chǔ) 16
2.3.1 最大似然估計(jì) 16
2.3.2 梯度分析 17
2.3.3 梯度下降法 19
2.3.4 梯度消失和梯度爆炸 19
2.4 本章小結(jié) 21
習(xí)題2 21
第3章 語言模型 22
3.1 語言模型概念及基礎(chǔ)理論 22
3.1.1 n元語法模型 22
3.1.2 神經(jīng)概率語言模型 24
3.1.3 預(yù)訓(xùn)練語言模型 24
3.2 語言模型性能評(píng)價(jià) 26
3.2.1 基于信息熵的語言模型復(fù)雜度度量 26
3.2.2 基于困惑度的語言模型復(fù)雜度度量 27
3.2.3 基于語言模型的漢語信息熵估算 28
3.3 數(shù)據(jù)平滑 28
3.3.1 問題的提出 28
3.3.2 加法平滑方法 29
3.3.3 Good-Turing估計(jì)法 29
3.3.4 Katz平滑方法 29
3.3.5 Jelinek-Mercer平滑方法 30
3.3.6 Witten-Bell平滑方法 31
3.3.7 絕對(duì)減值法 32
3.4 神經(jīng)網(wǎng)絡(luò)語言模型 32
3.4.1 基礎(chǔ)模型 32
3.4.2 CNN模型 33
3.4.3 RNN模型及其變體 34
3.4.4 Attention模型 37
3.4.5 Transformer模型 40
3.5 語言模型應(yīng)用舉例 44
3.5.1 BERT模型 44
3.5.2 短文本表示 46
3.5.3 Softmax回歸模型 46
3.6 本章小結(jié) 47
習(xí)題3 47
第4章 隱馬爾可夫模型與條件隨機(jī)場(chǎng) 49
4.1 馬爾可夫模型 49
4.1.1 馬爾可夫過程 49
4.1.2 馬爾可夫性 49
4.2 隱馬爾可夫模型 50
4.2.1 隱馬爾可夫模型的基本理論 50
4.2.2 估計(jì)問題 52
4.2.3 序列問題 54
4.2.4 參數(shù)估計(jì)問題 55
4.3 HMM應(yīng)用舉例 57
4.3.1 中文分詞 57
4.3.2 詞性標(biāo)注 58
4.4 條件隨機(jī)場(chǎng)及其應(yīng)用 59
4.4.1 條件隨機(jī)場(chǎng)概念 59
4.4.2 條件隨機(jī)場(chǎng)應(yīng)用 64
4.5 本章小結(jié) 67
習(xí)題4 67
第5章 詞法分析與詞性標(biāo)注 68
5.1 漢語自動(dòng)分詞 68
5.1.1 分詞規(guī)范問題 68
5.1.2 歧義切分問題 69
5.1.3 未登錄詞問題 69
5.1.4 漢語自動(dòng)分詞的原則 70
5.1.5 分詞與詞性標(biāo)注結(jié)果評(píng)估方法 71
5.2 自動(dòng)分詞基本算法 72
5.2.1 最大匹配法 72
5.2.2 最短路徑方法 74
5.2.3 基于HMM的分詞方法 76
5.2.4 基于Bi-LSTM-CRF的分詞方法 80
5.3 未登錄詞識(shí)別 83
5.3.1 概述 83
5.3.2 基于決策樹的未登錄詞識(shí)別方法 85
5.3.3 基于統(tǒng)計(jì)和規(guī)則的未登錄詞識(shí)別方法 88
5.4 詞性標(biāo)注方法 91
5.4.1 概述 91
5.4.2 基于規(guī)則的詞性標(biāo)注方法 92
5.4.3 基于統(tǒng)計(jì)的詞性標(biāo)注方法 93
5.4.4 基于深度學(xué)習(xí)的詞性標(biāo)注方法 95
5.5 本章小結(jié) 97
習(xí)題5 97
第6章 語義分析 98
6.1 語義網(wǎng)絡(luò) 98
6.1.1 基本概念 98
6.1.2 語義標(biāo)注 99
6.2 概念依存 100
6.3 詞義消歧 101
6.3.1 基本內(nèi)容 101
6.3.2 理論方法 102
6.3.3 案例分析 104
6.4 詞向量表示與詞嵌入 106
6.4.1 基本內(nèi)容 106
6.4.2 理論方法 107
6.4.3 案例分析 110
6.5 語義分析在華為畢昇編譯器AI調(diào)優(yōu)中的應(yīng)用 112
6.5.1 基本內(nèi)容 112
6.5.2 理論方法 113
6.6 本章小結(jié) 114
習(xí)題6 114
第二部分 實(shí)踐應(yīng)用
第7章 機(jī)器翻譯 115
7.1 機(jī)器翻譯概述 115
7.1.1 機(jī)器翻譯方法概述 115
7.1.2 機(jī)器翻譯的研究現(xiàn)狀 118
7.2 統(tǒng)計(jì)機(jī)器翻譯 119
7.2.1 基于詞的機(jī)器翻譯 119
7.2.2 基于短語的機(jī)器翻譯 129
7.2.3 基于句子的機(jī)器翻譯 135
7.3 神經(jīng)機(jī)器翻譯 143
7.3.1 神經(jīng)機(jī)器翻譯概述 143
7.3.2 神經(jīng)機(jī)器翻譯模型 145
7.4 實(shí)戰(zhàn)GRU翻譯模型 147
7.4.1 基礎(chǔ)知識(shí)與環(huán)境配置 148
7.4.2 代碼實(shí)現(xiàn) 149
7.5 本章小結(jié) 153
習(xí)題7 153
第8章 文本分類、聚類和情感分析 154
8.1 文本分類 154
8.1.1 文本分類的定義 154
8.1.2 文本分類的發(fā)展 155
8.1.3 傳統(tǒng)文本分類的實(shí)現(xiàn) 155
8.1.4 基于深度學(xué)習(xí)的分類器設(shè)計(jì) 161
8.2 文本聚類 164
8.2.1 基于分層的文本聚類 165
8.2.2 基于劃分的文本聚類 166
8.3 情感分析 167
8.3.1 基于情感詞典的情感分析 167
8.3.2 基于深度學(xué)習(xí)的方面級(jí)情感分類算法 169
8.3.3 帶有Attention機(jī)制的LSTM網(wǎng)絡(luò)的方法 173
8.3.4 帶有Attention機(jī)制的雙向LSTM網(wǎng)絡(luò)的方法 175
8.4 本章小結(jié) 178
習(xí)題8 178
第9章 信息抽取 179
9.1 實(shí)體識(shí)別與抽取 179
9.1.1 命名實(shí)體識(shí)別概述 179
9.1.2 有監(jiān)督學(xué)習(xí)方法實(shí)現(xiàn)命名實(shí)體識(shí)別 180
9.1.3 基于深度學(xué)習(xí)的NER 183
9.2 實(shí)體消歧 184
9.2.1 實(shí)體消歧概述 184
9.2.2 基于上下文相似度的實(shí)體消歧 185
9.2.3 基于實(shí)體顯著性的實(shí)體消歧 186
9.2.4 基于實(shí)體關(guān)聯(lián)度的實(shí)體消歧 187
9.3 關(guān)系抽取 187
9.3.1 基于模式匹配的關(guān)系抽取 187
9.3.2 基于深度學(xué)習(xí)的關(guān)系抽取方法 188
9.3.3 關(guān)系抽取展望 190
9.4 事件抽取 190
9.4.1 事件抽取任務(wù)定義 191
9.4.2 基于模式匹配的事件抽取實(shí)現(xiàn) 191
9.4.3 基于深度學(xué)習(xí)的事件抽取實(shí)現(xiàn) 192
9.5 本章小結(jié) 194
習(xí)題9 194
第10章 知識(shí)圖譜 195
10.1 知識(shí)圖譜發(fā)展歷史 195
10.2 知識(shí)圖譜基本概念 198
10.2.1 知識(shí)庫的概念及分類 198
10.2.2 知識(shí)庫的表示形式 199
10.3 知識(shí)圖譜的生命周期 199
10.3.1 知識(shí)建模 200
10.3.2 知識(shí)抽取 204
10.3.3 知識(shí)融合 208
10.3.4 知識(shí)存儲(chǔ) 210
10.3.5 知識(shí)計(jì)算 213
10.3.6 知識(shí)圖譜應(yīng)用 215
10.4 知識(shí)圖譜的現(xiàn)有應(yīng)用 216
10.4.1 語義搜索 216
10.4.2 智能問答系統(tǒng) 217
10.4.3 輔助決策 217
10.4.4 個(gè)性化推薦 218
10.4.5 學(xué)科知識(shí)圖譜 218
10.5 本章小結(jié) 219
習(xí)題10 220
第11章 問答系統(tǒng)與人機(jī)對(duì)話系統(tǒng) 221
11.1 問答系統(tǒng) 221
11.1.1 系統(tǒng)構(gòu)成 221
11.1.2 基于信息檢索和答案選擇的混合式問答系統(tǒng) 223
11.2 基于大規(guī)模知識(shí)庫的問答系統(tǒng) 227
11.2.1 知識(shí)庫問答系統(tǒng)任務(wù) 228
11.2.2 基于中文知識(shí)圖譜的問答系統(tǒng) 229
11.3 閱讀理解式問答系統(tǒng) 234
11.4 對(duì)話系統(tǒng) 236
11.4.1 基于深度學(xué)習(xí)的多方對(duì)話系統(tǒng) 236
11.4.2 對(duì)話系統(tǒng)相關(guān)任務(wù) 239
11.5 醫(yī)學(xué)視覺問答 240
11.5.1 相關(guān)概念介紹 240
11.5.2 面向醫(yī)學(xué)數(shù)據(jù)特征優(yōu)化的視覺問答系統(tǒng) 241
11.6 問答系統(tǒng)在MindSpore框架中的應(yīng)用 248
11.6.1 華為昇思MindSpore框架 248
11.6.2 DAM模型 250
11.6.3 基于MindSpore框架的DAM模型分析 252
11.6.4 所用數(shù)據(jù)集` 252
11.7 本章小結(jié) 252
習(xí)題11 253
參考文獻(xiàn) 254