本書面向人工智能相關專業(yè)(智能科學與技術、控制科學與工程、計算機科學與技術)的本科生,以從人工智能角度理解模式識別和用模式識別原理解決工程問題為目標,將內(nèi)容分為基礎知識、模式分類和模式聚類三大部分,突出簡明和實用的特點。書中穿插大量案例,可以幫助學生在掌握基本概念的基礎上理解基本原理,熟悉典型方法,做到知其然,知其所以然。本書注重引導學生充分利用樣本數(shù)據(jù)庫和算法庫等各種網(wǎng)絡資源,通過課程學習、案例計算和算法實現(xiàn),分析來自生產(chǎn)和生活實際中的模式識別問題,采用合適的模式識別算法和技術,通過Python和MATLAB 編程構建自己的模式識別系統(tǒng)來解決這些問題,并能夠評估模式識別系統(tǒng)的性能和不足,理解不同模式識別算法的針對性和局限性,從而提高學生理論和實踐相結合、綜合運用所學知識解決具體模式識別問題的能力,培養(yǎng)學生深入學習更新、更先進的模式識別知識的興趣。
本書可作為普通高等院校自動化、人工智能、計算機相關專業(yè)的教材,也可作為從事人工智能和自動化系統(tǒng)開發(fā)應用人員的參考書。
本書遵循教指委相關指導文件和高等院校學生學習規(guī)律編寫而成。踐行四新理念,融入思政元素,注重理論與實踐相結合。
前言
模式(Pattern)泛指蘊含在數(shù)據(jù)記錄中能夠體現(xiàn)事物或?qū)ο竽撤N內(nèi)在屬性的結構、特征、規(guī)律、趨勢或聯(lián)系,通常表現(xiàn)為某種重復出現(xiàn)的特定結構或形式。它可以是一系列事件或行為經(jīng)常相伴發(fā)生或發(fā)展的方式,或者是一系列線條、圖案、形狀、顏色組織在一起反復出現(xiàn)的樣式。模式識別(Pattern Recognition)就是通過對表征事物、現(xiàn)象的各種信息描述(數(shù)據(jù)、波形、圖像、文字、邏輯關系和其他任何可測量特征的集合)進行辨認、分析和處理,發(fā)現(xiàn)隱含在數(shù)據(jù)中的模式和規(guī)律,用以推斷未知數(shù)據(jù)的特征或類別,有效地完成識別、分類、解釋、預測和決策等任務。
模式識別首先是人類思考問題、解決問題、認知事物、認識世界的一種方式。俗語說:物以類聚,人以群分。人們根據(jù)事物和對象特征的異同對其進行區(qū)分或歸類,這將帶來以下兩方面的好處:一是對認識和經(jīng)驗分門別類地進行整理,找出隱含在數(shù)據(jù)記錄中的規(guī)律,形成系統(tǒng)性的知識,方便記錄、學習和傳播;二是根據(jù)已有的知識觸類旁通地認知新事物,做到人們常說的以此類推和舉一反三。
模式識別然后才是一種人工智能的領域和方法,它受人類智慧的啟發(fā),模擬人類認知思考的模式和方法,以計算機為工具,綜合運用數(shù)值分析、概率統(tǒng)計、神經(jīng)網(wǎng)絡,以及其他機器學習和人工智能技術,尋找隱含在樣本數(shù)據(jù)背后的關聯(lián)性和相似性,自動識別并揭示事物之間的特定聯(lián)系、規(guī)律或趨勢,完成對對象的識別、分類、聚類、預測和決策。
模式和模式識別在概念上的寬泛性,源于模式識別應用范圍的廣泛性。模式識別無處不在(圖像識別、語音識別、文字識別等),其應用已經(jīng)遍及人們生活的方方面面。
模式識別應用于人類身份識別,包括人臉識別、指紋識別、語音識別、步態(tài)識別等,已經(jīng)在安防系統(tǒng)、手機支付、反恐等領域中獲得廣泛應用。
模式識別應用于基于內(nèi)容的檢索系統(tǒng),根據(jù)用戶提交到系統(tǒng)中的對象與互聯(lián)網(wǎng)上各種對象間的相似性進行信息查詢,例如輸入一幅圖像或一段視頻以檢索相似的圖像和視頻,輸入一段旋律以檢索相似的音樂作品等,極大地方便和豐富了人們的休閑娛樂生活。
模式識別將文字識別、語音識別、自然語言處理、語音合成等技術集成在一起,通過手機APP翻譯軟件實現(xiàn)了從圖像到文字的拍照翻譯、從文字到語言的朗讀、不同語言之間的實時互譯等功能,有效地促進了異國人士之間的交流,以及聾啞人和正常人的交流。
模式識別應用于工業(yè)機器人視覺系統(tǒng),通過在線分析圖像,既可以將產(chǎn)品自動區(qū)分為合格和不合格兩類,并完成合格品的自動裝箱和倉儲管理,也可以自動識別和定位不同的工件,并根據(jù)配合關系自動完成產(chǎn)品的在線裝配,從而顯著提高工業(yè)生產(chǎn)效率。
模式識別應用于家庭服務機器人,可以通過物體識別區(qū)分家居環(huán)境中的各種家具、工具、食品,通過人臉識別、語音識別、表情識別、手勢識別、情感識別與人交互,為人類提供陪伴交流和家居服務,通過助老助殘?zhí)嵘夏耆撕蜌埣踩说纳钯|(zhì)量。
模式識別應用于交通領域,汽車自動駕駛采用行人檢測、車道識別、交通信號識別等技術,不僅能夠有效地消除人為駕駛錯誤和疲勞駕駛,保障交通安全,而且能夠有效地減少交通擁堵,提高行車效率;交管部門采用車牌識別和車輛異常行為識別等技術,實現(xiàn)了車輛違章抓拍和停車場自動收費;智慧交通系統(tǒng)識別交通場景中的車輛行駛狀況和擁堵狀況,可以輔助交警進行交通調(diào)度,并幫助城市規(guī)劃部門設計新的道路改善方案。
模式識別應用于醫(yī)療領域,在醫(yī)學影像分析方面,基于諸如X光片、CT圖像、超聲波檢測圖像、心電圖、腦電圖、肌電圖等各種醫(yī)療檢測數(shù)據(jù),通過計算機輔助診斷可以有效地進行病理診斷,幫助醫(yī)生提高診斷的正確性和治療效率;基于生物信息學的基因比對和基因模式識別,幫助醫(yī)生發(fā)現(xiàn)特定基因序列與特殊疾病之間的因果關系,有助于發(fā)現(xiàn)癌癥和其他罕見病的治療方案。
模式識別應用于金融領域,通過金融數(shù)據(jù)分析和風險識別,可以有效地幫助人們進行股市預測、信用評分、欺詐檢測等,既可以識別異常交易和欺詐行為,發(fā)現(xiàn)潛在的風險因素和異常波動,幫助金融機構監(jiān)測和管理風險,提高金融安全,又可以識別市場需求和用戶偏好,幫助投資者做出更準確的投資決策或制定更有效的營銷策略。
總之,模式識別與人們的生活息息相關,其應用已經(jīng)深入人們工作和生活的方方面面。我們應該重視模式識別理論的發(fā)展以及模式識別技術的應用,尤其是要在普通高校的理工科學生中促進模式識別相關知識的普及,并在信息科學相關專業(yè)中推動模式識別課程教學改革的深入。
高教司順應時代的要求,主導推進戰(zhàn)略性新興領域十四五高等教育教材體系建設,以提高戰(zhàn)略性新興領域人才培養(yǎng)質(zhì)量。這是一個非常明智和及時的舉措。
作為長期從事模式識別相關教學和科研的高校一線教師,我們深知模式識別課程對于高校人工智能相關專業(yè)本科生知識架構和專業(yè)技能養(yǎng)成的重要性,也深感教材建設對于高校模式識別課程教學的重要性,因此,我們響應高教司的號召,把自己長期在一線教學科研中總結的經(jīng)驗融入這本教材的編寫,希望能夠?qū)V大青年學子對模式識別課程的學習有所裨益,也對我國高校人工智能學科教育教學的發(fā)展有所助力。
本書分為三部分。在基礎知識部分,重點講授模式識別的基本概念、模式識別系統(tǒng)的性能指標和一般結構等內(nèi)容;在模式分類部分,重點講授基于判別函數(shù)、統(tǒng)計理論、神經(jīng)網(wǎng)絡的模式分類等內(nèi)容;在模式聚類部分,重點講授動態(tài)聚類、層次聚類、高斯混合模型聚類、密度聚類等內(nèi)容。
由于編者學識水平所限,書中疏漏之處在所難免,還懇請各位同行專家不吝指正,以幫助我們及時修正完善。模式識別領域的發(fā)展日新月異,新的思想和方法層出不窮,在教學過程中,同行教師和青年學生如果有好的思路或建議,也請隨時和我們聯(lián)系交流,便于我們在后續(xù)版本更新中及時進行修訂。希望能夠在大家的幫助下完善本書,使其緊貼時代前進的脈搏,與時俱進地體現(xiàn)模式識別領域的最新發(fā)展,并因此能夠?qū)Ω鄬W子學習模式識別知識有所裨益,對我國人工智能科技的發(fā)展有所貢獻,這正是我們所熱切期待的。
以下是編者的聯(lián)系方式:北方工業(yè)大學張曉平zhangxp@ncut.edu.cn(第4章)
北京工業(yè)大學龔道雄gongdx@bjut.edu.cn(第7章)
姜華杰jianghj@bjut.edu.cn(第5、6章)
東北大學秦皇島分校趙玉良zhaoyuliang@neuq.edu.cn(第1章)
華南理工大學畢盛picy@scut.edu.cn(第2章)
董敏hollymin@scut.edu.cn(第3章)
羅家祥luojx@scut.edu.cn(第8章)
編者
目錄
前言
第1部分基 礎 知 識
第1章模式識別系統(tǒng)的構成和基本概念
1.1模式和模式識別
1.1.1模式識別范疇
1.1.2模式識別問題的數(shù)學表達
1.2模式識別系統(tǒng)的基本構成
1.3模式識別的基本概念
1.3.1模式識別的分類和聚類
1.3.2樣本、特征和特征空間
1.3.3特征選擇與降維
1.3.4距離與相似性度量
1.4模式識別系統(tǒng)的性能指標
1.4.1評估和優(yōu)化模型性能的關鍵指標
1.4.2泛化、欠擬合與過擬合
1.4.3評估方法
本章小結
習題
參考文獻
第2部分模 式 分 類
第2章基于判別函數(shù)的模式分類
2.1線性分類器
2.1.1線性判別函數(shù)與決策面
2.1.2最小二乘誤差分類(LMSE)
2.1.3Fisher線性判別分析(FLDA)
2.1.4支持向量機(SVM)
2.2非線性分類器
2.2.1多項式分類器
2.2.2分段線性函數(shù)分類器
2.2.3k近鄰算法
2.2.4決策樹算法
2.3組合分類器
2.3.1Bagging算法
2.3.2Boosting算法(含AdaBoost算法)
2.3.3隨機森林
本章小結
習題
參考文獻
第3章基于統(tǒng)計理論的模式分類
3.1貝葉斯決策和貝葉斯分類器
3.1.1最小風險決策
3.1.2最小錯誤率決策
3.1.3樸素貝葉斯分類器
3.1.4正態(tài)分布下的貝葉斯分類器
3.2Neyman-Pearson決策
3.2.1Neyman-Pearson決策的算法原理
3.2.2Neyman-Pearson決策的模式分類應用舉例
3.3最大似然估計
3.3.1最大似然估計的算法原理
3.3.2最大似然估計的模式分類應用舉例
3.4期望最大化(EM)方法
3.4.1期望最大化方法
3.4.2期望最大化方法的模式分類應用舉例
本章小結
習題
參考文獻
第4章基于神經(jīng)網(wǎng)絡的模式分類
4.1基于多層前饋神經(jīng)網(wǎng)絡的模式分類
4.1.1神經(jīng)元模型
4.1.2多層前饋神經(jīng)網(wǎng)絡
4.1.3BP算法
4.1.4多層前饋神經(jīng)網(wǎng)絡的模式分類應用舉例
4.2基于卷積神經(jīng)網(wǎng)絡的模式分類
4.2.1卷積神經(jīng)網(wǎng)絡的結構
4.2.2卷積神經(jīng)網(wǎng)絡的訓練和模式分類應用舉例
4.3基于循環(huán)神經(jīng)網(wǎng)絡的模式分類
4.3.1循環(huán)神經(jīng)網(wǎng)絡的結構
4.3.2循環(huán)神經(jīng)網(wǎng)絡的訓練和模式分類應用舉例
4.4基于Transformer的模式分類
4.4.1Transformer的結構
4.4.2Transformer的訓練和模式分類應用舉例
4.5基于YOLOvX的視覺模式識別
4.5.1YOLOvX網(wǎng)絡的基本原理
4.5.2YOLOv8網(wǎng)絡的訓練和目標檢測應用舉例
本章小結
習題
參考文獻
第3部分模 式 聚 類
第5章動態(tài)聚類
5.1動態(tài)聚類的算法特點和適用場合
5.2典型的動態(tài)聚類算法
5.2.1k均值算法
5.2.2ISODATA聚類算法
5.3動態(tài)聚類應用舉例
本章小結
習題
參考文獻
第6章層次聚類
6.1層次聚類的算法特點和適用場合
6.2典型的層次聚類算法
6.2.1自下而上的聚集聚類算法(Agglomerative)
6.2.2自上而下的分裂聚類算法(Divisive)
6.3層次聚類算法應用舉例
本章小結
習題
參考文獻
第7章高斯混合模型聚類
7.1GMM的算法特點和適用場合
7.2GMM算法
7.2.1高斯分布
7.2.2GMM的算法原理
7.2.3GMM的參數(shù)學習
7.2.4應用EM算法訓練GMM模型
7.2.5GMM組件個數(shù)的確定
7.3GMM聚類的應用舉例
7.4GMM聚類的函數(shù)指令和編程實現(xiàn)
7.4.1MATLAB常用的GMM聚類函數(shù)
7.4.2Python常用的GMM聚類指令
7.4.3GMM聚類的Python程序代碼舉例
本章小結
習題
參考文獻
第8章密度聚類
8.1基于密度的聚類
8.2DBSCAN算法
8.2.1算法基本思想
8.2.2確定參數(shù)Eps和MinPts
8.2.3性能評估
8.3OPTICS聚類
8.3.1基于密度的聚類排序
8.3.2識別聚類結構
本章小結
習題
參考文獻