Agent(智能體)是大模型落地的重要方向,是AI技術(shù)的下一個(gè)風(fēng)口。為了讓更多非技術(shù)出身的人能夠通俗地理解Agent,并零門檻利用Agent開發(fā)平臺(tái)設(shè)計(jì)自己的Agent,我們撰寫了本書。 本書分為入門篇、工具篇、實(shí)戰(zhàn)篇。入門篇介紹了Agent的概念、發(fā)展、與Prompt和Copilot的區(qū)別,Agent對(duì)個(gè)人和企業(yè)的價(jià)值,以及開發(fā)Agent需要掌握的基礎(chǔ)知識(shí)。工具篇詳細(xì)介紹了Agent開發(fā)平臺(tái)的演進(jìn),盤點(diǎn)了國內(nèi)的主流Agent開發(fā)平臺(tái),重點(diǎn)介紹了扣子平臺(tái)的操作要點(diǎn),并提出了Agent開發(fā)的通用流程。實(shí)戰(zhàn)篇圍繞5個(gè)典型的Agent使用場景,詳細(xì)介紹了11個(gè)Agent的開發(fā)過程。 本書適合對(duì)AI感興趣的讀者閱讀,包括學(xué)習(xí)Agent的開發(fā)者、想要提升工作效率的職場人、推動(dòng)企業(yè)AI深化應(yīng)用的管理者、希望在AI領(lǐng)域創(chuàng)業(yè)的人、學(xué)校的老師和學(xué)生等。 無論你是哪種類型的讀者,本書都能幫助你系統(tǒng)并且輕松地掌握Agent從概念到實(shí)操的相關(guān)知識(shí)、技能和方法,讓你在AI時(shí)代更好地適應(yīng)工作和生活。
(1)不懂編程是很多人開發(fā)Agent的痛點(diǎn),扣子提供了一個(gè)零門檻開發(fā)Agent的平臺(tái)。通過可視化設(shè)計(jì),不懂編程也能開發(fā)Agent。
(2)沒有開發(fā)思路也不用擔(dān)心,本書詳細(xì)介紹了開發(fā)Agent的實(shí)施框架,即明確應(yīng)用場景、梳理業(yè)務(wù)流程和分析痛點(diǎn)、梳理Agent的功能定位和開發(fā)需求、繪制Agent的運(yùn)行流程圖、設(shè)置大模型及參數(shù)、設(shè)計(jì)提示詞、配置Agent技能、設(shè)計(jì)用戶溝通頁面、測試與調(diào)優(yōu)、發(fā)布。只要懂業(yè)務(wù)就能開發(fā)Agent,如果懂代碼就可以更好地開發(fā)Agent。
(3)AI Agent在個(gè)人工作提效、企業(yè)降本增效、提升生產(chǎn)力上都有巨大潛力。掌握先進(jìn)生產(chǎn)力,快人一步。
以ChatGPT的發(fā)布為標(biāo)志,我們似乎進(jìn)入了一個(gè)新的時(shí)代。生成式AI(人工智能)技術(shù)正在以前所未有的速度發(fā)展。AI技術(shù)被認(rèn)為是一項(xiàng)顛覆性的創(chuàng)新技術(shù),甚至被認(rèn)為催生了第四次工業(yè)革命。截至2024年10月,我國大模型的注冊(cè)用戶數(shù)超過6億,人工智能企業(yè)已超過4500戶,完成備案并上線的生成式人工智能服務(wù)大模型超過200個(gè)。
當(dāng)您閱讀本書時(shí),相信您對(duì)AI技術(shù)已不再陌生,您身邊的人,或多或少、或主動(dòng)或被動(dòng),對(duì)AI技術(shù)可能都有一定的了解。有的人在日常工作中已經(jīng)離不開AI工具了,借助各類AI工具,工作效率和工作質(zhì)量都有了明顯提高;有的人的商業(yè)嗅覺敏銳,已經(jīng)投身于AI應(yīng)用的創(chuàng)業(yè)大潮中;有的人看到了AI技術(shù)未來會(huì)帶來企業(yè)運(yùn)營模式和成本結(jié)構(gòu)的改變,開始在自己的企業(yè)中引進(jìn)AI數(shù)字員工,實(shí)現(xiàn)降本增效。當(dāng)然,也有的人雖然了解AI概念,但親自使用AI工具的頻率還不高。
總體來看,目前還處于AI技術(shù)發(fā)展的早期,如何將大模型應(yīng)用到具體的業(yè)務(wù)場景中,實(shí)現(xiàn)商業(yè)價(jià)值變現(xiàn),是AI創(chuàng)業(yè)者和從業(yè)者在探索的重要課題。在這一背景下,AI Agent(智能體,簡稱Agent)應(yīng)運(yùn)而生,成為AI落地的重要方向。
Agent是利用大模型構(gòu)建的面向業(yè)務(wù)場景的AI應(yīng)用,在大模型能力的基礎(chǔ)上,通過記憶、規(guī)劃、使用工具等能力,能夠執(zhí)行更復(fù)雜的任務(wù)。與使用Prompt(提示詞)和大模型對(duì)話相比,Agent更智能、更有效。
Agent開發(fā)平臺(tái)最早于2022年在國外出現(xiàn),如LangChain、LlamaIndex等平臺(tái),主要面向的是技術(shù)人員。開發(fā)者需要通過編程語言完成Agent開發(fā),這存在較高的技術(shù)門檻。隨著Agent開發(fā)平臺(tái)的進(jìn)化,Agent開發(fā)朝著可視化、零代碼的方向發(fā)展。自2023年開始,國內(nèi)的Agent開發(fā)平臺(tái)快速崛起,以扣子(Coze)為代表的Agent開發(fā)平臺(tái),在功能、生態(tài)等方面都較為成熟,可以與國外的Agent開發(fā)平臺(tái)相媲美。
現(xiàn)在,開發(fā)者無須使用編程語言,通過拖、拉、拽的可視化操作,就可以開發(fā)具有復(fù)雜功能的Agent。開發(fā)者可以在Agent開發(fā)平臺(tái)上自由配置Agent的插件、知識(shí)庫、數(shù)據(jù)庫,設(shè)計(jì)具有大量節(jié)點(diǎn)的工作流、圖像流,通過卡片等功能美化生成結(jié)果的頁面。
然而,隨著Agent開發(fā)平臺(tái)的功能越來越豐富,以及Agent開發(fā)者的多元化和非專業(yè)化,對(duì)于初級(jí)開發(fā)者而言,準(zhǔn)確地理解并靈活使用Agent開發(fā)平臺(tái)的各項(xiàng)功能和操作技巧,顯然有一定的難度。
于是,我們撰寫了本書,旨在為廣大Agent開發(fā)者和AI技術(shù)愛好者提供一條系統(tǒng)、快捷、實(shí)用的學(xué)習(xí)路徑,幫助他們從零開始,逐步掌握開發(fā)Agent的技能。
在撰寫本書的過程中,我們力求將復(fù)雜的技術(shù)概念以簡單明了的方式呈現(xiàn),并通過大量案例增加內(nèi)容的可讀性。需要說明的是,Agent開發(fā)平臺(tái)日新月異,您在閱讀本書時(shí)所看到的部分內(nèi)容,可能與Agent開發(fā)平臺(tái)新的頁面略有不同。您需要結(jié)合實(shí)際靈活運(yùn)用書中的知識(shí)。當(dāng)然,我們非常注重讀者的反饋。
最后,我們要感謝所有為本書付出辛勤努力的作者、編輯和其他人員。同時(shí),也感謝廣大讀者的支持與信任。愿本書能夠?yàn)槟?Agent 開發(fā)之旅增添一分力量。讓我們一起通過點(diǎn)滴行動(dòng),推動(dòng)AI技術(shù)落地和應(yīng)用!
葉濤壹啟同輝創(chuàng)始人,擁有管理咨詢和AI培訓(xùn)咨詢雙重工作背景與經(jīng)驗(yàn)。AI時(shí)代新咨詢倡導(dǎo)者:15年管理咨詢工作經(jīng)驗(yàn),中國企業(yè)聯(lián)合會(huì)戰(zhàn)略咨詢專業(yè)委員會(huì)成員,全國中小企業(yè)管理咨詢服務(wù)專家信息庫專家。曾擔(dān)任知名上市咨詢機(jī)構(gòu)董事、常務(wù)副總裁。專注于幫助成長性企業(yè)構(gòu)建AI時(shí)代的組織能力,實(shí)現(xiàn)經(jīng)營突破。主導(dǎo)過100多個(gè)咨詢項(xiàng)目成功交付,輔導(dǎo)過多家企業(yè)實(shí)現(xiàn)業(yè)績倍增和組織升級(jí)。AI場景化落地賦能師:系統(tǒng)提出個(gè)人和組織應(yīng)用AI技術(shù)的底層方法論C-SMT能力框架,基于業(yè)務(wù)場景提供AI賦能培訓(xùn)和企業(yè)AI咨詢服務(wù)。AICX公眾號(hào)創(chuàng)辦人。AICX是一個(gè)備受好評(píng)的專業(yè)自媒體賬號(hào),分享AI技術(shù)在工作、生活中的應(yīng)用。管鍇武漢大學(xué)管理學(xué)碩士,擁有多年企業(yè)高層管理經(jīng)驗(yàn)和6年企業(yè)管理咨詢經(jīng)驗(yàn)。致力于研究如何將AI技術(shù)有效地應(yīng)用于企業(yè)運(yùn)營中,以實(shí)現(xiàn)降本增效的目標(biāo)。張心雨西北工業(yè)大學(xué)工學(xué)學(xué)士,香港理工大學(xué)管理學(xué)碩士。曾在頭部地產(chǎn)公司從事人力資源管理工作多年。持續(xù)研究AI技術(shù)在工作和生活中的應(yīng)用。
入門篇人人都需要AI Agent
第1章 為什么要學(xué)習(xí)AI Agent 3
1.1 初步認(rèn)識(shí)Agent 3
1.1.1 Agent的概念與發(fā)展 3
1.1.2 Agent是高層級(jí)的AI技術(shù)應(yīng)用 5
1.1.3 Agent的特點(diǎn)與能力 7
1.2 Agent讓大模型更可用 8
1.2.1 大模型 Agent,實(shí)現(xiàn)AI應(yīng)用場景化 8
1.2.2 Agent讓傳統(tǒng)軟件更智能 9
1.2.3 百花齊放,Agent是下一代應(yīng)用 11
1.3 Agent對(duì)個(gè)人和企業(yè)的價(jià)值 12
1.3.1 Agent影響個(gè)人工作和生活方式 12
1.3.2 Agent助力企業(yè)降本增效 14
第2章 開發(fā)Agent的知識(shí)儲(chǔ)備 18
2.1 了解Agent的工作原理 18
2.1.1 Agent的基本決策流程:感知規(guī)劃行動(dòng) 18
2.1.2 Agent的4大能力:規(guī)劃、記憶、使用工具、行動(dòng) 19
2.1.3 Agent相關(guān)術(shù)語 20
2.2 規(guī)劃Agent業(yè)務(wù)場景所需的業(yè)務(wù)流程知識(shí) 24
2.2.1 開發(fā)Agent為什么要學(xué)習(xí)業(yè)務(wù)流程知識(shí) 24
2.2.2 Agent開發(fā)者的業(yè)務(wù)流程工具箱 26
2.3 開發(fā)Agent是否需要掌握編程技術(shù) 30
2.3.1 借助Agent開發(fā)平臺(tái),不會(huì)編程也可以開發(fā)Agent 30
2.3.2 掌握編程技術(shù),有助于Agent開發(fā)進(jìn)階 32
工具篇Agent開發(fā)很簡單
第3章 認(rèn)識(shí)Agent開發(fā)平臺(tái) 35
3.1 Agent開發(fā)平臺(tái)的演進(jìn) 35
3.1.1 什么是Agent開發(fā)平臺(tái) 35
3.1.2 國外的Agent開發(fā)平臺(tái)的進(jìn)化歷程 37
3.1.3 Agent開發(fā)平臺(tái)的發(fā)展趨勢 40
3.2 國內(nèi)的Agent開發(fā)平臺(tái)速覽 41
3.2.1 國內(nèi)的Agent開發(fā)平臺(tái)梳理 41
3.2.2 Agent開發(fā)平臺(tái)綜合對(duì)比 49
3.3 扣子國內(nèi)版 52
3.3.1 扣子的特點(diǎn) 52
3.3.2 扣子的功能布局與使用技巧速覽 53
第4章 開發(fā)Agent的流程與策略 58
4.1 開發(fā)Agent的通用流程 58
4.1.1 開發(fā)Agent的3-10實(shí)施框架 58
4.1.2 規(guī)劃Agent 59
4.1.3 設(shè)計(jì)Agent 61
4.1.4 上線Agent 67
4.2 開發(fā)Agent的策略 69
4.2.1 懂場景和業(yè)務(wù),比懂AI技術(shù)更重要 70
4.2.2 通過工具拓展能力,是Agent具有價(jià)值的關(guān)鍵 70
4.2.3 堅(jiān)持小而美,聚焦特定的應(yīng)用場景和功能 71
4.2.4 把Agent當(dāng)成助手,而不是一個(gè)完全托管的解決方案 71
第5章 Agent開發(fā)的功能模塊詳解插件、工作流、圖像流 72
5.1 插件 72
5.1.1 什么是插件 72
5.1.2 在扣子的插件商店中給Agent配置插件 80
5.1.3 通過API文檔創(chuàng)建插件 83
5.2 工作流 92
5.2.1 工作流的組成 93
5.2.2 工作流節(jié)點(diǎn)詳解 94
5.2.3 創(chuàng)建、鏈接測試及發(fā)布工作流 112
5.3 圖像流 114
5.3.1 圖像流的組成 115
5.3.2 圖像流的工具詳解 115
5.3.3 創(chuàng)建和使用圖像流 123
5.3.4 圖像流實(shí)戰(zhàn)案例換臉 126
第6章 Agent開發(fā)的功能模塊詳解知識(shí)庫、記憶與對(duì)話體驗(yàn) 128
6.1 知識(shí)庫 128
6.1.1 什么是Agent知識(shí)庫 128
6.1.2 Agent知識(shí)庫的功能 128
6.1.3 Agent知識(shí)庫的運(yùn)行邏輯 129
6.1.4 創(chuàng)建知識(shí)庫 131
6.1.5 使用知識(shí)庫 142
6.2 變量 144
6.2.1 什么是變量 144
6.2.2 變量的應(yīng)用 145
6.3 數(shù)據(jù)庫 146
6.3.1 什么是數(shù)據(jù)庫 146
6.3.3 Agent數(shù)據(jù)庫的應(yīng)用 147
6.4 卡片 150
6.5 其他技能項(xiàng) 153
6.5.1 長期記憶 153
6.5.2 文件盒子 154
6.5.3 對(duì)話體驗(yàn)及角色 157
實(shí)戰(zhàn)篇5大場景、11個(gè)Agent案例
第7章 開發(fā)專業(yè)分析類Agent 163
7.1 業(yè)務(wù)場景解讀:對(duì)特定領(lǐng)域長文檔的深度理解與專業(yè)輸出 163
7.1.1 什么是專業(yè)分析類Agent 163
7.1.2 專業(yè)分析類Agent的使用場景 164
7.1.3 專業(yè)分析類Agent的3大核心功能 165
7.2 入門案例1:AI投標(biāo)助手 166
7.2.1 規(guī)劃Agent:自動(dòng)檢索招標(biāo)文件關(guān)鍵信息的投標(biāo)助手 166
7.2.2 AI投標(biāo)助手的開發(fā)過程詳解 168
7.2.3 AI投標(biāo)助手的運(yùn)行效果 179
7.3 進(jìn)階案例2:調(diào)研診斷Agent 182
7.3.1 規(guī)劃Agent:可替代初級(jí)顧問的AI數(shù)字員工 182
7.3.2 調(diào)研診斷Agent的開發(fā)過程詳解 185
7.2.3 調(diào)研診斷Agent的運(yùn)行效果 198
7.4 舉一反三:專業(yè)分析類Agent的開發(fā)小結(jié) 202
第8章 開發(fā)角色扮演類Agent 204
8.1 業(yè)務(wù)場景解讀:讓Agent具有鮮明的人物個(gè)性及能力標(biāo)簽 204
8.1.1 什么是角色扮演類Agent 204
8.1.2 角色扮演類Agent的使用場景 204
8.1.3 角色扮演類Agent的核心功能和開發(fā)要點(diǎn) 205
8.2 入門案例1:小學(xué)生的英語口語陪練Agent 206
8.2.1 規(guī)劃Agent:小學(xué)生的英語口語陪練引導(dǎo)老師 206
8.2.2 小學(xué)生的英語口語陪練Agent的開發(fā)過程詳解 207
8.2.3 小學(xué)生的英語口語陪練Agent的運(yùn)行效果 209
8.3 進(jìn)階案例2:模擬面試官Agent 210
8.3.1 規(guī)劃Agent:幫助提升面試水平的模擬面試官 210
8.3.2 模擬面試官Agent的開發(fā)過程詳解 212
8.3.3 模擬面試官Agent的運(yùn)行效果 215
8.4 進(jìn)階案例3:多專家Agent 218
8.4.1 多Agent系統(tǒng)的概念與現(xiàn)狀 218
8.4.2 設(shè)計(jì)意大利旅行Agent 219
8.5 舉一反三:角色扮演類Agent的開發(fā)小結(jié) 230
第9章 開發(fā)知識(shí)問答類Agent 231
9.1 業(yè)務(wù)場景解讀:基于對(duì)知識(shí)的理解提供更專業(yè)的回復(fù) 231
9.1.1 什么是知識(shí)問答類Agent 231
9.1.2 知識(shí)問答類Agent的使用場景 233
9.1.3 知識(shí)問答類Agent的3大開發(fā)要點(diǎn) 234
9.2 入門案例1:公司首席知識(shí)官Agent 236
9.2.1 規(guī)劃Agent:變被動(dòng)管理企業(yè)知識(shí)為主動(dòng)響應(yīng) 236
9.2.2 公司首席知識(shí)官Agent的開發(fā)過程詳解 238
9.2.3 公司首席知識(shí)官Agent的運(yùn)行效果 247
9.3 進(jìn)階案例2:全能助理問問Agent 249
9.3.1 規(guī)劃Agent:萬能問答小助手 249
9.3.2 全能助理問問Agent的開發(fā)過程詳解 250
9.3.3 全能助理問問Agent的運(yùn)行效果 260
9.4 舉一反三:知識(shí)問答類Agent的開發(fā)小結(jié) 263
第10章 開發(fā)內(nèi)容營銷和自媒體運(yùn)營類Agent 264
10.1 業(yè)務(wù)場景解讀:基于豐富的語料和語音能力提高大模型的創(chuàng)作力 264
10.1.1 什么是內(nèi)容營銷和自媒體運(yùn)營類Agent 264
10.1.2 內(nèi)容營銷和自媒體運(yùn)營類Agent的使用場景 265
10.1.3 內(nèi)容營銷和自媒體運(yùn)營類Agent的核心功能和開發(fā)要點(diǎn) 266
10.2 入門案例1:每日AI簡報(bào)Agent 266
10.2.1 規(guī)劃Agent:自動(dòng)化的新媒體運(yùn)營官 266
10.2.2 每日AI簡報(bào)Agent的開發(fā)過程詳解 267
10.2.3 每日AI簡報(bào)Agent的運(yùn)行效果 271
10.3 進(jìn)階案例2:抖音熱點(diǎn)視頻轉(zhuǎn)小紅書圖文筆記Agent 273
10.3.1 規(guī)劃Agent:跨平臺(tái)自動(dòng)轉(zhuǎn)換文案的達(dá)人 273
10.3.2 抖音熱點(diǎn)視頻轉(zhuǎn)小紅書圖文筆記Agent的開發(fā)過程詳解 275
10.3.3 抖音熱點(diǎn)視頻轉(zhuǎn)小紅書圖文筆記Agent的運(yùn)行效果 285
10.3.4 復(fù)盤 286
10.4 舉一反三:內(nèi)容營銷和自媒體運(yùn)營類Agent的開發(fā)小結(jié) 287
第11章 開發(fā)效率辦公類Agent 289
11.1 業(yè)務(wù)場景解讀:日常辦公流程的智能化與自動(dòng)化 289
11.1.1 什么是效率辦公類Agent 289
11.1.2 效率辦公類Agent的使用場景 290
11.1.3 效率辦公類Agent的核心功能和開發(fā)要點(diǎn) 291
11.2 入門案例1:文本糾錯(cuò)助手Agent 292
11.2.1 規(guī)劃Agent:提高文檔質(zhì)量的AI助手 292
11.2.2 文本糾錯(cuò)助手Agent的開發(fā)詳解 294
11.2.3 文本糾錯(cuò)助手Agent的運(yùn)行效果 298
11.3 進(jìn)階案例2:會(huì)議紀(jì)要助手Agent 299
11.3.1 規(guī)劃Agent:可以自動(dòng)化生成會(huì)議紀(jì)要的AI數(shù)字員工 299
11.3.2 會(huì)議紀(jì)要助手Agent的開發(fā)過程詳解 301
11.3.3 會(huì)議紀(jì)要助手Agent的運(yùn)行效果 311
11.4 舉一反三:效率辦公類Agent的開發(fā)小結(jié) 313