AIGC基礎(chǔ)、應(yīng)用與展望
定 價(jià):59.8 元
叢書(shū)名:高等學(xué)校數(shù)智人才培養(yǎng)AI通識(shí)精品系列
AI是近年來(lái)炙手可熱的前沿技術(shù)。隨著越來(lái)越多的AI應(yīng)用進(jìn)入人們的視野,AI技術(shù)也贏(yíng)得了國(guó)內(nèi)外社會(huì)公眾、專(zhuān)家、學(xué)者和開(kāi)發(fā)者的廣泛關(guān)注。 自2022年ChatGPT橫空出世以來(lái),AIGC迅速成為極其火爆的AI發(fā)展方向。近年來(lái),各種AIGC大模型層出不窮,AIGC大模型生成的內(nèi)容也日臻完善,并且已經(jīng)達(dá)到可以落地應(yīng)用的程度,因此可能創(chuàng)造大量的就業(yè)機(jī)會(huì)。 本書(shū)概述了AIGC的基礎(chǔ)技術(shù),從機(jī)器學(xué)習(xí)、深度學(xué)習(xí)的基本概念和基礎(chǔ)算法,到生成模型、自然語(yǔ)言處理和計(jì)算機(jī)視覺(jué)的相關(guān)技術(shù),即使是沒(méi)有學(xué)過(guò) AI 基礎(chǔ)知識(shí)的讀者,也可以輕松入門(mén)。本書(shū)還從眾多AIGC大模型中選擇了具有代表性的大模型進(jìn)行解讀,使讀者能夠輕松理解其工作原理,內(nèi)容涵蓋代碼生成、圖像生成、語(yǔ)音生成和視頻生成等諸多應(yīng)用領(lǐng)域。在此基礎(chǔ)上,本書(shū)還將帶領(lǐng)讀者一起試用各種類(lèi)型的AIGC大模型,使讀者能夠直觀(guān)體驗(yàn)AIGC大模型落地應(yīng)用的效果。 本書(shū)既可作為高校人工智能通識(shí)課程或AIGC相關(guān)課程的教材,也可作為相關(guān)領(lǐng)域的從業(yè)人員入門(mén)了解AI的參考用書(shū)。
1.面向通識(shí)教育,構(gòu)建知識(shí)體系 本書(shū)從最基礎(chǔ)的 AI 概念入手,沿著 AI 基礎(chǔ)概念、機(jī)器學(xué)習(xí)基礎(chǔ)、深度學(xué)習(xí)基礎(chǔ)、AIGC背后的基礎(chǔ)技術(shù)、AIGC 大模型的學(xué)習(xí)路線(xiàn)逐層遞進(jìn),讀者不需要學(xué)習(xí)其他基礎(chǔ)課程,即可讀懂書(shū)中的內(nèi)容。AI 是以計(jì)算機(jī)科學(xué)為基礎(chǔ),涉及計(jì)算機(jī)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)等知識(shí)的交叉學(xué)科。書(shū)中講到涉及其他學(xué)科的知識(shí)時(shí),都會(huì)提前介紹,比如第 2 章介紹生成模型時(shí)涉及較多統(tǒng)計(jì)學(xué)的知識(shí),因此 2.1.3 小節(jié)講解了生成模型中用到的統(tǒng)計(jì)學(xué)概念,為讀者學(xué)習(xí)和理解后面的內(nèi)容奠定基礎(chǔ)。 2.理論深度較淺,適合入門(mén)學(xué)習(xí) AI 模型的核心技術(shù)是算法和模型的網(wǎng)絡(luò)結(jié)構(gòu)。模型的網(wǎng)絡(luò)結(jié)構(gòu)是算法的具體實(shí)現(xiàn),而理解深度學(xué)習(xí)模型(特別是 AIGC 大模型)中的算法需要很多數(shù)學(xué)知識(shí)。為了便于初學(xué)者理解深度學(xué)習(xí)模型的工作原理,本書(shū)只簡(jiǎn)要介紹一些基礎(chǔ)算法的數(shù)學(xué)公式,而在介紹深度學(xué)習(xí)模型時(shí),通常只介紹其網(wǎng)絡(luò)結(jié)構(gòu),不涉及算法的數(shù)學(xué)公式,因?yàn)槌鯇W(xué)者只要理解模型的工作原理即可,不需要掌握設(shè)計(jì) AI 模型的理論與技術(shù)。 3.緊跟時(shí)代發(fā)展,融合前沿技術(shù) AIGC 技術(shù)在近幾年高速發(fā)展,涌現(xiàn)出很多新技術(shù)和新的 AIGC 大模型。為了讓讀者能夠緊跟 AIGC 技術(shù)發(fā)展的潮流,本書(shū)不但重點(diǎn)講解了經(jīng)典 AIGC 技術(shù)大語(yǔ)言模型的工作原理和具體應(yīng)用,還介紹了 AIGC 在代碼生成、圖像生成、語(yǔ)音生成和視頻生成等領(lǐng)域的應(yīng)用。書(shū)中講解的很多 AIGC 大模型都是近年來(lái)推出的新模型,涵蓋了 AIGC 技術(shù)的最新發(fā)展趨勢(shì)。 4.創(chuàng)新教材形態(tài),助力讀者自學(xué) 編者結(jié)合書(shū)中重點(diǎn)內(nèi)容錄制了大量微課,為讀者開(kāi)展高效自學(xué)提供了便捷路徑,并提供豐富的教輔資源,以幫助院校老師快速開(kāi)展教學(xué)。為了便于初學(xué)者理解 AIGC 大模型的具體應(yīng)用,本書(shū)還設(shè)計(jì)了各種體驗(yàn)任務(wù),可與讀者共同體驗(yàn)大語(yǔ)言模型和各種多模態(tài) AIGC 大模型的應(yīng)用效果,使讀者在體驗(yàn)豐富、新奇的 AI 技術(shù)的同時(shí),加深對(duì)基礎(chǔ)理論和 AIGC 大模型工作原理的理解,實(shí)現(xiàn)理論性、趣味性與實(shí)用性相結(jié)合。
賈小林: 教授,博士生導(dǎo)師,畢業(yè)于西南交通大學(xué),獲工學(xué)博士學(xué)位;現(xiàn)任計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院副院長(zhǎng),分工負(fù)責(zé)本專(zhuān)科教育教學(xué)與改革、專(zhuān)業(yè)建設(shè)與評(píng)估、教學(xué)研究、本科人才培養(yǎng)團(tuán)隊(duì)建設(shè)等工作,分管教學(xué)科研辦公室。四川省普通本科高校教學(xué)指導(dǎo)委員會(huì)委員,國(guó)際電子電器工程師學(xué)會(huì)(IEEE)高級(jí)會(huì)員,中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)高級(jí)會(huì)員,CCF優(yōu)秀傳播大使,四川省海外高層次留學(xué)人才,綿陽(yáng)市4 3高端成長(zhǎng)型產(chǎn)業(yè)領(lǐng)軍人才,綿陽(yáng)市優(yōu)秀教師,西南科技大學(xué)十佳崗位青年、優(yōu)秀共產(chǎn)黨員、優(yōu)秀教師、教學(xué)名師等,入選西南科技大學(xué)70周年校慶特輯《龍山薪火-西南科大人之教師篇》;主要從事射頻識(shí)別(RFID)技術(shù)、物聯(lián)網(wǎng)(IOT)技術(shù)、計(jì)算機(jī)應(yīng)用技術(shù)等領(lǐng)域的研究和教學(xué)工作;主持完成國(guó)家自然科學(xué)基金面上項(xiàng)目、四川省科技支撐計(jì)劃重大項(xiàng)目、四川省應(yīng)用基礎(chǔ)研究項(xiàng)目、四川省高校成果轉(zhuǎn)化重大培育項(xiàng)目、制造過(guò)程測(cè)試技術(shù)重點(diǎn)實(shí)驗(yàn)室重點(diǎn)項(xiàng)目等重要研究課題;研究成果榮獲四川省科學(xué)技術(shù)進(jìn)步二等獎(jiǎng)1項(xiàng),四川省高等教育教學(xué)成果三等獎(jiǎng)2項(xiàng),西南科技大學(xué)優(yōu)秀教學(xué)成果一等獎(jiǎng)1項(xiàng)。 李曉黎: 軟件開(kāi)發(fā)工程師,畢業(yè)于吉林大學(xué)計(jì)算機(jī)系;自2006年以來(lái),帶領(lǐng)團(tuán)隊(duì)一直從事網(wǎng)絡(luò)管理軟件、企業(yè)ERP系統(tǒng)和電商平臺(tái)等的開(kāi)發(fā)與建設(shè)工作,具有中國(guó)投資銀行、國(guó)家開(kāi)發(fā)銀行、中信銀行等多家銀行從業(yè)經(jīng)歷,參與銀行信息化建設(shè)、網(wǎng)銀平臺(tái)開(kāi)發(fā)、智能合約設(shè)計(jì)與開(kāi)發(fā)工作多年,在人工智能、AIGC、Java程序設(shè)計(jì)、系統(tǒng)軟件開(kāi)發(fā)、團(tuán)隊(duì)組織管理和系統(tǒng)架構(gòu)設(shè)計(jì)等領(lǐng)域積累了豐富的實(shí)戰(zhàn)經(jīng)驗(yàn),主編圖書(shū)10余本,并被上百所高校選作教材。
【章名目錄】 【第 1篇 導(dǎo)論篇】 第 1章 AI技術(shù)概述 【第 2篇 基礎(chǔ)篇】 第 2章 生成模型 第3章 自然語(yǔ)言處理經(jīng)典模型 第4章 計(jì)算機(jī)視覺(jué)經(jīng)典模型 【第3篇 應(yīng)用篇】 第5章 大語(yǔ)言模型 第6章 代碼生成大語(yǔ)言模型 第7章 圖像生成大模型 第8章 語(yǔ)音生成大模型 第9章 視頻生成大模型 【第4篇 展望篇】 第 10章 AIGC時(shí)代的機(jī)遇、挑戰(zhàn)及發(fā)展趨勢(shì) 附錄 大語(yǔ)言模型智能體精選與推薦 【詳細(xì)目錄】 【第 1篇 導(dǎo)論篇】 第 1章 AI技術(shù)概述 1.1 AI技術(shù)基礎(chǔ) 2 1.1.1 AI技術(shù)的發(fā)展歷程 2 1.1.2 AI領(lǐng)域的常用概念 4 1.2 機(jī)器學(xué)習(xí)基礎(chǔ) 7 1.2.1 機(jī)器學(xué)習(xí)的三要素 7 1.2.2 機(jī)器學(xué)習(xí)的分類(lèi) 8 1.2.3 機(jī)器學(xué)習(xí)的工作流程 10 1.2.4 機(jī)器學(xué)習(xí)案例:使用線(xiàn)性回歸算法預(yù)測(cè)房?jī)r(jià) 11 1.3 深度學(xué)習(xí)基礎(chǔ) 16 1.3.1 深度學(xué)習(xí)的概念 16 1.3.2 前饋神經(jīng)網(wǎng)絡(luò)與反向傳播算法 17 1.3.3 深度學(xué)習(xí)案例:基于LeNet-5模型識(shí)別手寫(xiě)數(shù)字 17 1.3.4 深度學(xué)習(xí)的常用基礎(chǔ)函數(shù)和算法 18 1.3.5 深度學(xué)習(xí)的基本工作流程 23 1.4 AIGC的發(fā)展歷史、應(yīng)用方向及基礎(chǔ)技術(shù) 25 1.4.1 AIGC的發(fā)展歷史 25 1.4.2 AIGC的應(yīng)用方向 26 1.4.3 AIGC的基礎(chǔ)技術(shù) 28 本章小結(jié) 32 習(xí)題 32 課程實(shí)踐 33 【第 2篇 基礎(chǔ)篇】 第 2章 生成模型 2.1 生成模型技術(shù)基礎(chǔ) 35 2.1.1 生成模型和判別模型 35 2.1.2 生成模型的分類(lèi) 36 2.1.3 生成模型中用到的統(tǒng)計(jì)學(xué)概念 37 2.2 深度生成模型 42 2.2.1 GAN模型 42 2.2.2 自回歸模型 44 2.2.3 擴(kuò)散模型 44 2.2.4 VAEs模型 46 2.2.5 標(biāo)準(zhǔn)化流模型 49 本章小結(jié) 50 習(xí)題 50 課程實(shí)踐 50 第3章 自然語(yǔ)言處理經(jīng)典模型 3.1 NLP技術(shù)的發(fā)展歷程和應(yīng)用現(xiàn)狀 52 3.1.1 NLP技術(shù)的發(fā)展歷程 52 3.1.2 NLP技術(shù)的應(yīng)用現(xiàn)狀 54 3.2 NLP技術(shù)基礎(chǔ) 55 3.2.1 文本的數(shù)值化表示 56 3.2.2 NLP模型 59 3.2.3 注意力機(jī)制 60 3.2.4 語(yǔ)料庫(kù) 66 3.3 經(jīng)典N(xiāo)LP深度學(xué)習(xí)模型 67 3.3.1 RNN模型 67 3.3.2 編碼器-解碼器架構(gòu) 69 3.3.3 LSTM模型 69 3.3.4 Transformer架構(gòu) 70 3.3.5 BERT模型 78 本章小結(jié) 80 習(xí)題 80 課程實(shí)踐 81 第4章 計(jì)算機(jī)視覺(jué)經(jīng)典模型 4.1 CV技術(shù)的發(fā)展歷程和應(yīng)用現(xiàn)狀 82 4.1.1 CV技術(shù)的發(fā)展歷程 82 4.1.2 CV技術(shù)的應(yīng)用現(xiàn)狀 84 4.2 CV技術(shù)基礎(chǔ) 85 4.2.1 圖像的表現(xiàn)形式 86 4.2.2 數(shù)字圖像處理 87 4.3 經(jīng)典CV模型 89 4.3.1 CNN模型 89 4.3.2 ResNet模型 96 4.3.3 ViT模型 97 本章小結(jié) 100 習(xí)題 100 課程實(shí)踐 100 【第3篇 應(yīng)用篇】 第5章 大語(yǔ)言模型 5.1 大語(yǔ)言模型概述 102 5.1.1 大語(yǔ)言模型的定義 102 5.1.2 大語(yǔ)言模型的工作原理 104 5.1.3 大語(yǔ)言模型落地應(yīng)用的方法 105 5.2 主流大語(yǔ)言模型簡(jiǎn)析 105 5.2.1 國(guó)外主流大語(yǔ)言模型 105 5.2.2 國(guó)內(nèi)主流大語(yǔ)言模型 107 5.3 GPT系列模型的工作原理 109 5.3.1 GPT-1 109 5.3.2 GPT-2 113 5.3.3 GPT-3 120 5.3.4 GPT-3.5和GPT-4 122 5.4 體驗(yàn)主流大語(yǔ)言模型 123 5.4.1 設(shè)計(jì)體驗(yàn)任務(wù) 123 5.4.2 體驗(yàn)大語(yǔ)言模型的方法 125 5.4.3 體驗(yàn)純文本任務(wù) 127 5.4.4 體驗(yàn)多模態(tài)任務(wù) 131 本章小結(jié) 137 習(xí)題 138 課程實(shí)踐 138 第6章 代碼生成大語(yǔ)言模型 6.1 代碼生成大語(yǔ)言模型概述 139 6.1.1 什么是代碼生成大語(yǔ)言模型 139 6.1.2 代碼生成大語(yǔ)言模型的基本工作原理 141 6.2 主流代碼生成大語(yǔ)言模型選解 142 6.2.1 GitHub Copilot 142 6.2.2 CodeWhisperer 143 6.2.3 CodeGeeX 143 6.2.4 CodeBERT 146 6.3 體驗(yàn)CodeWhisperer 148 6.3.1 在IDEA中安裝AWS Toolkit插件 148 6.3.2 在IDEA中使用CodeWhisperer 149 6.3.3 Amazon Q Chat 150 6.3.4 在開(kāi)發(fā)過(guò)程中利用CodeWhisperer的編碼建議 152 6.4 體驗(yàn)CodeGeeX 154 6.4.1 在VS Code中安裝CodeGeeX插件 154 6.4.2 在VS Code中使用CodeGeeX 155 本章小結(jié) 160 習(xí)題 160 課程實(shí)踐 160 第7章 圖像生成大模型 7.1 圖像生成大模型的工作原理 161 7.1.1 圖像嵌入 161 7.1.2 圖像生成大模型的基本工作流程 162 7.1.3 條件生成模型 163 7.1.4 建立文圖聯(lián)系的CLIP模型 165 7.2 主流圖像生成大模型選解 168 7.2.1 國(guó)外的圖像生成大模型 168 7.2.2 國(guó)內(nèi)的圖像生成大模型 175 7.3 體驗(yàn)圖像生成大模型 176 7.3.1 體驗(yàn)圖像生成大模型的方法 176 7.3.2 設(shè)計(jì)體驗(yàn)任務(wù) 180 7.3.3 體驗(yàn)生成人物攝影圖像 183 7.3.4 體驗(yàn)生成風(fēng)景植物圖像 186 7.3.5 體驗(yàn)生成建筑設(shè)計(jì)圖像 188 7.3.6 體驗(yàn)生成中國(guó)風(fēng)格圖像 190 本章小結(jié) 192 習(xí)題 192 課程實(shí)踐 192 第8章 語(yǔ)音生成大模型 8.1 語(yǔ)音生成大模型的工作原理 193 8.1.1 TTS技術(shù)的發(fā)展歷史 193 8.1.2 梅爾頻譜 194 8.1.3 TTS的工作原理 194 8.2 語(yǔ)音生成大模型選解 195 8.2.1 XTTS模型 195 8.2.2 Mega-TTS模型 196 8.3 體驗(yàn)語(yǔ)音生成大模型 198 本章小結(jié) 199 習(xí)題 199 課程實(shí)踐 200 第9章 視頻生成大模型 9.1 視頻生成大模型的基礎(chǔ)技術(shù) 201 9.1.1 視頻表示 201 9.1.2 條件概率視頻生成大模型的概念 201 9.2 主流視頻生成大模型選解 202 9.2.1 Sora模型的工作原理 202 9.2.2 MagicVideo-V2模型的工作原理 205 9.3 體驗(yàn)主流視頻生成大模型 206 9.3.1 Gen-3模型生成的視頻 206 9.3.2 Pika模型生成的視頻 207 9.3.3 MagicVideo-V2模型生成的視頻 208 本章小結(jié) 209 習(xí)題 209 課程實(shí)踐 209 【第4篇 展望篇】 第 10章 AIGC時(shí)代的機(jī)遇、挑戰(zhàn)及發(fā)展趨勢(shì) 10.1 AIGC的社會(huì)影響 211 10.1.1 AIGC對(duì)社會(huì)經(jīng)濟(jì)的影響 211 10.1.2 AIGC對(duì)普通人生活的影響 212 10.2 AIGC時(shí)代的機(jī)遇和挑戰(zhàn) 213 10.2.1 AIGC時(shí)代的機(jī)遇 213 10.2.2 AIGC時(shí)代的挑戰(zhàn) 216 10.3 AIGC技術(shù)所面臨的挑戰(zhàn)及發(fā)展趨勢(shì) 221 10.3.1 AIGC技術(shù)的倫理問(wèn)題和所面臨的挑戰(zhàn) 221 10.3.2 AIGC技術(shù)的發(fā)展趨勢(shì) 224 本章小結(jié) 227 習(xí)題 228 課程實(shí)踐 228 附錄 大語(yǔ)言模型智能體精選與推薦 F.1 文心智能體平臺(tái) 229 F.2 通義智能體 229 F.3 ChatAI的定制模型 230 F.4 DeepSeek智能體 231