(1)故事化講解:以故事為線索,跟主角一起輕松掌握機(jī)器學(xué)習(xí)精髓。
(2)階梯式學(xué)習(xí):從傳統(tǒng)機(jī)器學(xué)習(xí)到Transformer架構(gòu),助力穩(wěn)步掌握關(guān)鍵知識(shí)與技能。
(3)場(chǎng)景化教學(xué):緊密貼合實(shí)際,聚焦生活案例,讓算法原理在真實(shí)場(chǎng)景中落地。
(4)智能體開發(fā)指南:教你運(yùn)用現(xiàn)有工具創(chuàng)建智能體,快速搭建個(gè)性化AI智能體。
前言開始旅程
首先,感謝大家翻開本書。本書中,我們將會(huì)跟著主人公大學(xué)生村官小 L開啟一次有趣的旅程。在本次的旅程中,小 L 將使用各種人工智能技術(shù),包括經(jīng)典的機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、生成式模型、多模態(tài)模型等,幫助他所任職的地區(qū)完成一個(gè)又一個(gè)任務(wù)。跟隨他的腳步,我們會(huì)學(xué)習(xí)到什么是機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)、變分自編碼器、自回歸模型、標(biāo)準(zhǔn)化流模型、Transformer 模型,以及如何用 Transformers 庫(kù)調(diào)用不同的預(yù)訓(xùn)練模型等。
需要說明的是,本書的實(shí)操部分使用的是 Python 語(yǔ)言,因此需要讀者有一定的 Python 編碼能力?紤]到不是所有的讀者都有圖形處理器(GPU)算力環(huán)境,這里我們給大家推薦兩個(gè)可以在云端進(jìn)行實(shí)驗(yàn)的平臺(tái),分別是 Google 的 Colab 和數(shù)據(jù)科學(xué)競(jìng)賽平臺(tái) Kaggle。截至 2025 年 1 月,這兩個(gè)平臺(tái)都給用戶提供了一定限額的免費(fèi) GPU 算力,可以讓讀者以最小的成本開始進(jìn)行實(shí)驗(yàn)。
接下來,我們看一下如何使用這兩個(gè)平臺(tái)。
Colab
登錄 Colab 平臺(tái),在菜單欄中選擇文件菜單中的在云端硬盤中新建筆記本命令,如圖 1 所示。
圖 1 使用 Colab 新建筆記本
然后,就可以在新建的空白筆記本的單元格中運(yùn)行代碼了,如圖 2 所示。
圖 2 在 Colab 的筆記本中運(yùn)行代碼
在 Colab 的筆記本中編寫和運(yùn)行代碼的方式與在本地計(jì)算機(jī)的 Jupyter Notebook中操作大體是一樣的。如果我們要把本地的數(shù)據(jù)上傳到 Colab 上用于模型訓(xùn)練,只要單擊左邊菜單欄中的文件夾圖標(biāo),并在展開的菜單中單擊上傳到會(huì)話存儲(chǔ)空間按鈕即可,如圖 3 所示。
圖 3 上傳本地?cái)?shù)據(jù)到 Colab
我們?cè)谧约旱挠?jì)算機(jī)上寫好的代碼,也可以上傳到 Colab 平臺(tái),使用免費(fèi)的 GPU 來進(jìn)行模型訓(xùn)練。要上傳編輯好的筆記本文件,只要在 Colab 的歡迎界面中,選擇文件菜單中的上傳筆記本
命令即可,如圖 4 所示。
圖 4 上傳編寫好的筆記本文件到 Colab
在本書附贈(zèng)的資源包中,如果看到 .ipynb 文件標(biāo)有run on colab,就說明這個(gè)文件可以上傳到 Colab 中進(jìn)行實(shí)驗(yàn)。
Kaggle
登錄 Kaggle 平臺(tái)之后,就可以單擊左邊菜單欄中的Create按鈕新建一個(gè)筆記本文件,如圖5 所示。
圖 5 在 Kaggle 平臺(tái)新建筆記本文件
單擊Create按鈕后,選擇New Notebook命令,就可以看到我們新創(chuàng)建的筆記本文件。這個(gè)時(shí)候,我們?nèi)匀豢梢陨蟼髯约罕镜氐墓P記本文件。只需要選擇File菜單中的ImportNotebook命令就可以了,如圖 6 所示。
同樣地,大家如果下載了隨書贈(zèng)送的資源包,看到筆記本文件標(biāo)有run on kaggle的字樣,就說明這個(gè)文件可以在 Kaggle 平臺(tái)中運(yùn)行。當(dāng)然,Kaggle 也支持我們上傳自己的數(shù)據(jù)集和模型,只要在右側(cè)菜單欄中單擊Upload按鈕就可以,如圖 7 所示。
圖 6 將本地的筆記本文件導(dǎo)入 Kaggle 中圖 7 在 Kaggle 平臺(tái)上傳數(shù)據(jù)集或模型
除了以上基本操作,Colab 和 Kaggle 還有很多實(shí)用的功能,如選擇不同的 GPU 加速等,這些留給讀者朋友們自己探索。
還要跟大家強(qiáng)調(diào)一下,本書中涉及的人物、地名、事件以及用于說明原理的數(shù)據(jù),均為虛構(gòu),僅僅是為了演示技術(shù)原理,與現(xiàn)實(shí)世界沒有任何關(guān)聯(lián),請(qǐng)大家一定不要對(duì)號(hào)入座。
注意:如果讀者在訪問 Colab 時(shí)遇到障礙,請(qǐng)向你所在的學(xué);騿挝簧暾(qǐng)專用網(wǎng)絡(luò),確保自己在遵守相關(guān)法律法規(guī)的前提下進(jìn)行實(shí)驗(yàn)。
到這里,相信大家已經(jīng)做好了啟程的準(zhǔn)備,讓我們出發(fā)吧!
溫馨提示:
本書贈(zèng)送資源已上傳至百度網(wǎng)盤,供讀者下載。讀者可用微信掃一掃功能掃描封底二維碼,關(guān)注微信公眾號(hào),輸入本書 77 頁(yè)資源下載碼,根據(jù)提示獲取下載地址及密碼。
段小手,曾供職于百度、敦煌網(wǎng)、慧聰網(wǎng)、方正集團(tuán)等知名IT企業(yè)。有多年的科技項(xiàng)目管理及開發(fā)經(jīng)驗(yàn)。2019年至今,與云南省公安廳合作數(shù)據(jù)挖掘項(xiàng)目,使用機(jī)器學(xué)習(xí)技術(shù)協(xié)助云南警方打擊違法犯罪活動(dòng)。
其負(fù)責(zé)的項(xiàng)目曾獲得國(guó)家發(fā)改委電子商務(wù)示范項(xiàng)目中關(guān)村現(xiàn)代服務(wù)業(yè)試點(diǎn)項(xiàng)目北京市信息化基礎(chǔ)設(shè)施提升專項(xiàng)北京市外貿(mào)公共服務(wù)平臺(tái)等多項(xiàng)政策支持。著有《深度學(xué)習(xí)與大模型基礎(chǔ)》《巧用AI大模型輕松學(xué)會(huì)Python金融數(shù)據(jù)分析》等著作,在與云南省公安廳合作期間,使用機(jī)器學(xué)習(xí)算法有效將某類案件發(fā)案率大幅降低。