大模型項(xiàng)目實(shí)戰(zhàn):Agent開(kāi)發(fā)與應(yīng)用 高強(qiáng)文
定 價(jià):89 元
叢書名:智能系統(tǒng)與技術(shù)叢書
當(dāng)前圖書已被 1 所學(xué)校薦購(gòu)過(guò)!
查看明細(xì)
- 作者:高強(qiáng)文
- 出版時(shí)間:2025/3/1
- ISBN:9787111777335
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類:TP18
- 頁(yè)碼:
- 紙張:膠版紙
- 版次:
- 開(kāi)本:16開(kāi)
這是一本面向初中級(jí)讀者的Agent學(xué)習(xí)指南,作者既是資深的AI技術(shù)專家,又是經(jīng)驗(yàn)豐富的項(xiàng)目導(dǎo)師,融合作者親身實(shí)踐、培訓(xùn)反饋與官方資源,為Agent使用者和開(kāi)發(fā)者提供了快速上手的實(shí)用指導(dǎo)。
本書從基礎(chǔ)知識(shí)、操作和應(yīng)用開(kāi)發(fā)3個(gè)維度循序漸進(jìn)地講解Agent實(shí)戰(zhàn)技巧,分為三篇:
?基礎(chǔ)篇(1~2章) 介紹Agent定義、發(fā)展歷程、常用開(kāi)源技術(shù)、主要組件等基礎(chǔ)知識(shí)和開(kāi)發(fā)環(huán)境的搭建過(guò)程。
?應(yīng)用篇(3~6章) 從通用型、任務(wù)驅(qū)動(dòng)型、輔助開(kāi)發(fā)型和檢索增強(qiáng)型 4大類,通過(guò)AutoGPT、MemGPT、BabyAGI、Camel、Devika、CodeFuse-ChatBot、DB-GPT、QAnything這8種具體類型,詳細(xì)描述Agent的安裝、配置和使用等操作步驟。
?開(kāi)發(fā)篇(7~16章) 展開(kāi)分析10個(gè)不同場(chǎng)景的Agent應(yīng)用開(kāi)發(fā)實(shí)例。一方面,以AgentScope、LangChain、LangGraph、AutoGen、LlamaIndex、CrewAI、Qwen-Agent這7種被廣泛應(yīng)用的開(kāi)源Agent開(kāi)發(fā)框架為基礎(chǔ),針對(duì)每個(gè)框架各講解一個(gè)開(kāi)發(fā)案例。另一方面,通過(guò)案例介紹Agent開(kāi)發(fā)過(guò)程中關(guān)鍵的Function-calling特性及大語(yǔ)言模型開(kāi)發(fā)技術(shù)。此外,對(duì)基于CogVLM2的多模態(tài)模型應(yīng)用開(kāi)發(fā),也提供詳細(xì)的案例演示。
(1)實(shí)力派作者,洞察讀者實(shí)際需求:作者既是資深A(yù)I技術(shù)專家,也是經(jīng)驗(yàn)豐富的項(xiàng)目導(dǎo)師,深諳行業(yè)動(dòng)態(tài)和讀者需求。本書融合了作者的實(shí)踐經(jīng)驗(yàn)、培訓(xùn)反饋與官方資源,提供了一套快速上手、實(shí)用高效的指導(dǎo)方案。
(2)翔實(shí)內(nèi)容,降低開(kāi)發(fā)門檻:本書采用開(kāi)源框架,降低選型成本。書中深入剖析AI Agent的核心原理及15種主流框架,并通過(guò)10個(gè)不同領(lǐng)域的實(shí)例詳細(xì)講解實(shí)戰(zhàn)技巧,操作步驟細(xì)致、源代碼完整,助力讀者迅速掌握關(guān)鍵技術(shù)。
(3)貼近實(shí)際,滿足職場(chǎng)與創(chuàng)業(yè)需求:這是一本面向初中級(jí)讀者的Agent學(xué)習(xí)指南,覆蓋職場(chǎng)應(yīng)用與創(chuàng)業(yè)項(xiàng)目的實(shí)際場(chǎng)景,幫助Agent使用者和開(kāi)發(fā)者實(shí)現(xiàn)定制化開(kāi)發(fā),切實(shí)滿足多樣化的行業(yè)需求。
前 言
AI Agent(或簡(jiǎn)稱為Agent)是建立在大語(yǔ)言模型之上的智能應(yīng)用,是將人工智能與特定場(chǎng)景深度結(jié)合的重要方式。Agent模仿人類“思考–行動(dòng)–觀察”的規(guī)劃模式,具備自主思考和自主決策的能力,能夠適應(yīng)環(huán)境的變化,自主學(xué)習(xí)和改進(jìn),完成用戶設(shè)定的目標(biāo)。與大語(yǔ)言模型的對(duì)話應(yīng)用不同,Agent的突出特點(diǎn)是主動(dòng)性,在行為上表現(xiàn)為多步操作、多角色會(huì)話、多輪迭代、反復(fù)修正答案以及調(diào)用外部資源的能力。
20世紀(jì)80年代,對(duì)于AI Agent是否能夠真正產(chǎn)生自主性的、生物意義上的“智能”這一問(wèn)題已在哲學(xué)層面展開(kāi)討論。20年前,深度學(xué)習(xí)的發(fā)展促進(jìn)了Agent的進(jìn)化。近幾年來(lái),在大語(yǔ)言模型的支持下,Agent越來(lái)越具備主動(dòng)性,“思考”問(wèn)題的方法也在參考人類特征的基礎(chǔ)上,形成一套包含規(guī)劃、記憶、工具和行動(dòng)的功能規(guī)范。在Agent與大語(yǔ)言模型技術(shù)結(jié)合方面,ReAct、ToT、Reflexion、CoT等思考框架的研究成果不斷,相關(guān)論文以及與之配套的開(kāi)源代碼詮釋了理論如何變?yōu)楝F(xiàn)實(shí)。看似眼花繚亂實(shí)則科學(xué)嚴(yán)謹(jǐn)?shù)奶崾驹~工程,在與大語(yǔ)言模型的交互中,使得Agent像施展魔法般地實(shí)現(xiàn)了人類預(yù)定的目標(biāo)。展望未來(lái),基于Agent,人們對(duì)通用人工智能(Artificial General Intelligence, AGI)充滿了想象空間。
Agent的發(fā)展離不開(kāi)大語(yǔ)言模型的支持,而大語(yǔ)言模型則通過(guò)Agent擴(kuò)展其功能。隨著GPT-4、GLM-4、Llama3、Qwen2等模型的發(fā)布,依托這些模型的應(yīng)用技術(shù)也取得了顯著的進(jìn)步,GPT-4率先推出了Function-calling功能,其他模型也迅速跟進(jìn)。這一創(chuàng)新反映了大語(yǔ)言模型將超越單純的內(nèi)容生成,向更智能、更主動(dòng)、更有規(guī)劃性的AGI方向發(fā)展。AutoGPT、BabyAGI等Agent應(yīng)用的推出,使代表著主動(dòng)思考、主動(dòng)決策、主動(dòng)執(zhí)行的AGI技術(shù)取得了長(zhǎng)足的進(jìn)步。同時(shí),LangChain、AutoGen等Agent開(kāi)發(fā)框架的問(wèn)世與流行,使這個(gè)領(lǐng)域的應(yīng)用開(kāi)發(fā)變得更加便捷,多角色、多模態(tài)的Agent應(yīng)用紛紛涌現(xiàn)。
目前,Agent正處于快速發(fā)展過(guò)程中,已在長(zhǎng)記憶會(huì)話、任務(wù)處理、檢索增強(qiáng)、輔助編程等領(lǐng)域產(chǎn)生了許多產(chǎn)品和應(yīng)用案例。本書詳細(xì)介紹了8種開(kāi)源的主流Agent應(yīng)用以及7種Agent開(kāi)發(fā)框架,從基礎(chǔ)、應(yīng)用、開(kāi)發(fā)三個(gè)層面對(duì)Agent知識(shí)進(jìn)行了循序漸進(jìn)的講解。考慮到實(shí)際應(yīng)用場(chǎng)景,本書還涵蓋了支撐Agent應(yīng)用的大型語(yǔ)言模型的安裝、服務(wù)開(kāi)發(fā)以及微調(diào)技術(shù),從而使Agent的知識(shí)體系更加完整。
本書特點(diǎn)
本書具有以下特點(diǎn):
基于開(kāi)源技術(shù):本書中涉及的所有Agent技術(shù)都是開(kāi)源項(xiàng)目,所使用的大模型也皆為開(kāi)源模型且可在本地部署,而非依賴OpenAI等云服務(wù)。案例代碼中不依賴額外的API,均可在本地部署的模型支持下進(jìn)行調(diào)試和運(yùn)行。此外,本書所有案例代碼已在GitHub上開(kāi)源。
技術(shù)廣泛:本書涵蓋了8種Agent應(yīng)用(應(yīng)用篇)和7種Agent開(kāi)發(fā)框架(開(kāi)發(fā)篇),共涉及15種開(kāi)源Agent技術(shù)。Agent正在快速發(fā)展,覆蓋的技術(shù)越多,讀者學(xué)習(xí)或深入研究的選擇越多。
國(guó)內(nèi)外并重:本書使用的技術(shù)中,國(guó)產(chǎn)Agent、國(guó)產(chǎn)大模型技術(shù)占有一定的比例,如QAnything、AgentScope、CodeFuse-ChatBot、Qwen-Agent、GLM-4、CogVLM2等。對(duì)于讀者來(lái)說(shuō),閱讀本書后,如果想了解相關(guān)技術(shù)細(xì)節(jié),那么國(guó)產(chǎn)項(xiàng)目的中文文檔更易于深入學(xué)習(xí)。
詳解大模型技術(shù):大語(yǔ)言模型是Agent的運(yùn)行基礎(chǔ),本書專門對(duì)大模型的開(kāi)發(fā)技術(shù)進(jìn)行了詳細(xì)講解,內(nèi)容包括大語(yǔ)言模型的應(yīng)用、服務(wù)開(kāi)發(fā)與微調(diào)。通過(guò)學(xué)習(xí),讀者能夠深入了解Agent背后的內(nèi)容生成原理。
案例涉及的領(lǐng)域廣泛:本書提供了10個(gè)不同場(chǎng)景的Agent應(yīng)用開(kāi)發(fā)案例,案例涉及的領(lǐng)域廣泛,且貼近讀者的學(xué)習(xí)與生活,如任務(wù)驅(qū)動(dòng)、多角色協(xié)同、輔助編程、RAG、圖像、多模態(tài)等,實(shí)用性強(qiáng)。
內(nèi)容來(lái)源
本書的內(nèi)容源于筆者的研究與實(shí)踐。在寫作過(guò)程中,我精心挑選了各類Agent技術(shù),涵蓋多個(gè)領(lǐng)域和場(chǎng)景,力求在知識(shí)的廣度和深度上都有所考量,希望為讀者提供多元化的參考。具體來(lái)說(shuō),本書的寫作素材來(lái)源主要包括以下幾個(gè)方面:
實(shí)踐案例:在本書撰寫過(guò)程中,我實(shí)踐了大量Agent應(yīng)用,并開(kāi)發(fā)了一系列多領(lǐng)域的示例程序。
官方資源:本書整合了來(lái)自各種Agent應(yīng)用和開(kāi)發(fā)框架的官網(wǎng)資料,確保得到官方的前沿信息。
培訓(xùn)課件:在過(guò)去兩年中,我作為培訓(xùn)講師,為教師、學(xué)生以及軟件企業(yè)舉辦了多場(chǎng)大語(yǔ)言模型培訓(xùn),其中,Agent實(shí)操課程也是一個(gè)重要的培訓(xùn)主題,因此獲得了大量學(xué)員反饋,從而優(yōu)化了本書內(nèi)容。
讀者對(duì)象
本書涉及的Agent技術(shù)豐富、操作步驟詳細(xì)、源代碼完整,適合Agent使用者和開(kāi)發(fā)者上手實(shí)踐。
對(duì)于使用者來(lái)說(shuō),8種典型的Agent開(kāi)源應(yīng)用,能夠滿足他們?cè)诓渴鹋c使用方面的需求。
對(duì)于開(kāi)發(fā)者來(lái)說(shuō),10個(gè)不同場(chǎng)景的Agent應(yīng)用開(kāi)發(fā)案例以及多種大語(yǔ)言模型服務(wù),能夠滿足他們學(xué)習(xí)、實(shí)踐的需求。
如何閱讀本書
這是一本講解Agent基礎(chǔ)知識(shí)、開(kāi)發(fā)與應(yīng)用方法的實(shí)戰(zhàn)指南,共分為三篇:
基礎(chǔ)篇:包括第1和2章,介紹了Agent定義、發(fā)展歷程、常用開(kāi)源技術(shù)、主要組件等基礎(chǔ)知識(shí)和開(kāi)發(fā)環(huán)境的搭建過(guò)程。
應(yīng)用篇:包括第3~6章,從通用型、任務(wù)驅(qū)動(dòng)型、輔助開(kāi)發(fā)型和檢索增強(qiáng)型的分類角度,介紹了AutoGPT、MemGPT、BabyAGI、Camel、Devika、CodeFuse-ChatBot、DB-GPT、QAnything這8種流行度高、社區(qū)完善、正在快速發(fā)展的開(kāi)源Agent應(yīng)用,描述其運(yùn)行原理、安裝方法和使用過(guò)程。
開(kāi)發(fā)篇:包括第7~16章,完成10個(gè)不同場(chǎng)景的Agent應(yīng)用開(kāi)發(fā)實(shí)戰(zhàn)。一方面,以AgentScope、LangChain、LangGraph、AutoGen、LlamaIndex、CrewAI、Qwen-Agent這7種目前被廣泛應(yīng)用的開(kāi)源Agent開(kāi)發(fā)框架為基礎(chǔ),針對(duì)每個(gè)框架各講解一個(gè)開(kāi)發(fā)案例。另一方面,通過(guò)案例介紹了Agent開(kāi)發(fā)過(guò)程中關(guān)鍵的Function-calling特性及大語(yǔ)言模型開(kāi)發(fā)技術(shù)。此外,對(duì)基于CogVLM2的多模態(tài)模型應(yīng)用開(kāi)發(fā),也提供了案例演示。
實(shí)踐要求及說(shuō)明
在本書的大部分示例中,Agent需要大語(yǔ)言模型具備Function-calling特性或?qū)ν评砟芰σ筝^高,所以基本上選用了8B、9B等參數(shù)規(guī)模的模型,運(yùn)行這些模型所需的GPU內(nèi)存在20GB左右。書中還涉及一些大模型的微調(diào)技術(shù)和多模態(tài)模型的應(yīng)用開(kāi)發(fā),所以至少需要1張24GB內(nèi)存的推理卡或顯卡。雖然部分示例在Ollama的量化環(huán)境下只需要6GB內(nèi)存即可正常運(yùn)行,但為了完整實(shí)踐所有示例,建議采用24GB或以上內(nèi)存的推理卡或顯卡,以及與之配套的服務(wù)器或高端個(gè)人計(jì)算機(jī)。
以下是關(guān)于閱讀與實(shí)踐本書內(nèi)容的注意事項(xiàng)。
①操作系統(tǒng)。Agent應(yīng)用服務(wù)本身可以運(yùn)行在Windows和Linux下。Agent需要大語(yǔ)言模型的支持,在本書所介紹的裝載大語(yǔ)言模型的三種方法中,只有Ollama支持Windows操作系統(tǒng),其余兩種由于依賴vLLM而不能在Windows上運(yùn)行。綜合以上情況,建議讀者在Ubuntu 22.04操作系統(tǒng)中實(shí)踐本書內(nèi)容。書中涉及的文件下載、文件編輯、文件復(fù)制等操作系統(tǒng)命令均使用了Linux的方式描述,如果讀者使用Windows,則要根據(jù)情況采用對(duì)應(yīng)的操作方法。
②命令換行。在操作系統(tǒng)命令行下執(zhí)行命令時(shí),Linux系統(tǒng)支持對(duì)較長(zhǎng)的命令采用“\”進(jìn)行換行,命令執(zhí)行結(jié)果不會(huì)發(fā)生變化,而在Windows系統(tǒng)中要將“\”換成“^”。
例如,以下命令在Linux系統(tǒng)中運(yùn)行正常:
pip install -r requirements.txt -i \
https://pypi.mirrors.ustc.edu.cn/simple
該命令如果要在Windows系統(tǒng)中正常運(yùn)行,則需要把首行行尾的“\”替換成“^”,格式如下:
pip install -r requirements.txt -i ^
https://pypi.mirrors.ustc.edu.cn/simple
③命令注釋。本書中描述的在操作系統(tǒng)命令行下執(zhí)行的命令,如果以“#”開(kāi)頭則為注釋,無(wú)須執(zhí)行。為了避免讀者將多條命令誤以為是一條連續(xù)的命令一起執(zhí)行而發(fā)生錯(cuò)誤,我一般會(huì)在每條命令的前一行加注釋。
④示例代碼。得益于Python語(yǔ)言的精練以及各種Agent開(kāi)發(fā)框架的封裝,本書的示例代碼大多在100行左右,開(kāi)發(fā)篇中列出的基本上都是完整源代碼。但書中為了詳細(xì)地解釋程序原理,特意對(duì)代碼進(jìn)行了分段敘述,這會(huì)因縮進(jìn)難以觀察而影響代碼的整體性和可讀性,建議讀者調(diào)試程序時(shí),從本書的配套代碼庫(kù)中下載所用的代碼。
⑤主機(jī)名稱。為了統(tǒng)一和規(guī)范書中程序的配置與訪問(wèn)方式,減少可能的歧義,本書采用以下約定:如果是本機(jī)地址,則使用127.0.0.1表示;如果涉及GPU服務(wù)器,則使用主機(jī)名“server-dev”指代。主機(jī)名對(duì)應(yīng)的IP地址可以通過(guò)配置DNS解析來(lái)確定,在Windows系統(tǒng)中修改C:\Windows\System32\drivers\etc\HOSTS文件,在Linux系統(tǒng)中修改/etc/hosts文件。
勘誤和支持
本書的所有源代碼和簡(jiǎn)要操作步驟,已在https://github.com/little51/agent-dev上開(kāi)源,讀者可自行查閱。
雖然我在寫作時(shí)已盡力謹(jǐn)慎,反復(fù)測(cè)試驗(yàn)證,但本書中仍可能出現(xiàn)一些疏漏或者不準(zhǔn)確之處,懇請(qǐng)讀者指正。若讀者有勘誤或意見(jiàn),可通過(guò)郵件little51@126.com反饋,或者在https://github.com/little51/agent-dev代碼庫(kù)上提交issue。
致謝
2023年以后,我一直從事大語(yǔ)言模型應(yīng)用開(kāi)發(fā)與培訓(xùn)工作。2024年初,我結(jié)合工作中積累的經(jīng)驗(yàn),對(duì)培訓(xùn)課件進(jìn)行整理,形成一些關(guān)于大模型應(yīng)用開(kāi)發(fā)的原始寫作素材,并獲得與機(jī)械工業(yè)出版社合作的機(jī)會(huì),開(kāi)始撰寫《大模型項(xiàng)目實(shí)戰(zhàn):多領(lǐng)域智能應(yīng)用開(kāi)發(fā)》一書。2024年7月,在該書的寫作接近尾聲時(shí),為期半個(gè)月的人工智能培訓(xùn)也在按計(jì)劃進(jìn)行,我將AI Agent的一些內(nèi)容加到課程中,得到了廣大學(xué)員的積極反饋和同事的建議,這激勵(lì)我撰寫一本關(guān)于Agent的圖書,于是我一邊開(kāi)發(fā)多個(gè)領(lǐng)域的Agent示例程序,一邊進(jìn)行文本書寫。經(jīng)過(guò)近三個(gè)月不停歇的工作,這本新書即將問(wèn)世。
在這一過(guò)程中,我要感謝以下朋友:
我要感謝我所在公司的集團(tuán)領(lǐng)導(dǎo)梁明道先生,在我的印象中,十年前他就開(kāi)始反復(fù)給我描繪“智體”的前景,這對(duì)我在Agent方面的研究大有裨益。在他的理論中,這種具有主動(dòng)性、自我決策和自動(dòng)執(zhí)行的實(shí)體,一定會(huì)成為AGI的發(fā)展方向。甚至在十年前,他就注冊(cè)了aiit.com這樣的四字域名,用于以后的智體產(chǎn)品研發(fā)與推廣。
感謝我的同事董煒,他一如既往、一絲不茍地安排培訓(xùn)工作,使我在培訓(xùn)過(guò)程中將所有精力都用到了課件的準(zhǔn)備和與學(xué)員的交流上。學(xué)員的學(xué)習(xí)反饋和他們對(duì)課程的建議,對(duì)本書中的Agent技術(shù)選型起到關(guān)鍵作用。
感謝我的同事楊樂(lè),他很早就開(kāi)始研究Agent開(kāi)發(fā),得知我打算寫一本該領(lǐng)域的圖書時(shí),他給了我很多建議,并協(xié)助我采購(gòu)了雙推理卡設(shè)備。具備一定算力的機(jī)器,是Agent開(kāi)發(fā)中最重要的基礎(chǔ)設(shè)施支持。
本書中涉及的Agent應(yīng)用與開(kāi)發(fā)框架以及各種大語(yǔ)言模型,都是開(kāi)源項(xiàng)目,而且很大一部分使用的是極其寬松的MIT授權(quán)方式。作為開(kāi)源社區(qū)的負(fù)責(zé)人和開(kāi)源的受益者,本書的示例源碼也全部開(kāi)源。感謝開(kāi)源!
高強(qiáng)文
高強(qiáng)文
資深A(yù)I技術(shù)專家與項(xiàng)目導(dǎo)師。作為數(shù)字技術(shù)正高級(jí)工程師,專注于人工智能大語(yǔ)言模型應(yīng)用開(kāi)發(fā)、開(kāi)源社區(qū)開(kāi)發(fā)與運(yùn)營(yíng)。
AI領(lǐng)域創(chuàng)業(yè)先鋒,寧夏回族自治區(qū)勞動(dòng)模范。現(xiàn)任互鏈高科(北京)技術(shù)發(fā)展有限公司總經(jīng)理,銀川方達(dá)電子系統(tǒng)工程有限公司董事長(zhǎng)。20多年來(lái),一直從事信息化、人工智能等產(chǎn)品研發(fā)與管理工作。
近年來(lái)積極投身于開(kāi)源事業(yè),開(kāi)發(fā)運(yùn)營(yíng)aliendao.cn、gitclone.com和opendao.cn等開(kāi)源社區(qū),在GitHub上貢獻(xiàn)了20多個(gè)開(kāi)源代碼庫(kù)。著有《大模型項(xiàng)目實(shí)戰(zhàn):多領(lǐng)域智能應(yīng)用開(kāi)發(fā)》,旨在為開(kāi)發(fā)者提供AI技術(shù)實(shí)踐指導(dǎo)。
目 錄
前言
基礎(chǔ)篇
第1章 Agent基礎(chǔ)知識(shí) 2
1.1 Agent的概念 2
1.2 Agent的發(fā)展歷程 3
1.2.1 Agent起源 3
1.2.2 將Agent引入AI領(lǐng)域 4
1.2.3 Agent技術(shù)進(jìn)化與理論完善 5
1.2.4 Agent的深度學(xué)習(xí)應(yīng)用 5
1.2.5 基于LLM的Agent 6
1.3 常用的Agent開(kāi)源技術(shù)及分類 6
1.4 Agent主要組件 10
1.4.1 大語(yǔ)言模型 11
1.4.2 規(guī)劃組件 12
1.4.3 記憶組件 15
1.4.4 工具組件 15
1.4.5 行動(dòng)組件 16
第2章 Agent應(yīng)用與開(kāi)發(fā)環(huán)境搭建 17
2.1 Agent應(yīng)用部署結(jié)構(gòu) 17
2.1.1 服務(wù)同機(jī)部署模式 18
2.1.2 服務(wù)分布式部署模式 19
2.2 Agent應(yīng)用環(huán)境安裝與驗(yàn)證 19
2.2.1 推理卡驅(qū)動(dòng)安裝 20
2.2.2 CUDA安裝 23
2.2.3 Anaconda安裝 25
2.2.4 Git安裝 26
2.2.5 應(yīng)用環(huán)境驗(yàn)證 26
2.2.6 關(guān)于開(kāi)發(fā)工具的建議 27
2.3 大語(yǔ)言模型的裝載及API服務(wù)搭建 27
2.3.1 Ollama 27
2.3.2 vLLM 30
2.3.3 GLM-4專用服務(wù) 32
應(yīng)用篇
第3章 通用型Agent應(yīng)用 37
3.1 AutoGPT:個(gè)人助理 37
3.1.1 AutoGPT介紹 37
3.1.2 AutoGPT原理 38
3.1.3 AutoGPT應(yīng)用 42
3.2 MemGPT:長(zhǎng)記憶會(huì)話應(yīng)用 47
3.2.1 MemGPT介紹 47
3.2.2 MemGPT原理 47
3.2.3 MemGPT應(yīng)用 52
第4章 任務(wù)驅(qū)動(dòng)型Agent應(yīng)用 56
4.1 BabyAGI:任務(wù)自驅(qū)動(dòng)應(yīng)用 56
4.1.1 BabyAGI介紹 56
4.1.2 BabyAGI原理 57
4.1.3 BabyAGI應(yīng)用 62
4.2 Camel:角色扮演應(yīng)用 65
4.2.1 Camel介紹 65
4.2.2 Camel原理 65
4.2.3 Camel應(yīng)用 67
第5章 輔助開(kāi)發(fā)型Agent應(yīng)用 70
5.1 Devika:AI“軟件工程師”應(yīng)用 70
5.1.1 Devika介紹 70
5.1.2 Devika原理 71
5.1.3 Devika應(yīng)用 75
5.2 CodeFuse-ChatBot:輔助編程應(yīng)用 79
5.2.1 CodeFuse-ChatBot介紹 79
5.2.2 CodeFuse-ChatBot原理 80
5.2.3 CodeFuse-ChatBot應(yīng)用 82
第6章 檢索增強(qiáng)型Agent應(yīng)用 85
6.1 DB-GPT:數(shù)據(jù)庫(kù)應(yīng)用 85
6.1.1 DB-GPT介紹 85
6.1.2 DB-GPT原理 86
6.1.3 DB-GPT應(yīng)用 88
6.2 QAnything:知識(shí)庫(kù)應(yīng)用 90
6.2.1 QAnything介紹 90
6.2.2 QAnything原理 91
6.2.3 QAnything應(yīng)用 93
開(kāi)發(fā)篇
第7章 大語(yǔ)言模型開(kāi)發(fā)與微調(diào) 97
7.1 開(kāi)發(fā)要點(diǎn) 97
7.2 GLM-4 98
7.2.1 GLM-4介紹 98
7.2.2 GLM-4安裝 98
7.2.3 Chat應(yīng)用開(kāi)發(fā) 99
7.2.4 GLM-4兼容API服務(wù)開(kāi)發(fā) 102
7.2.5 GLM-4微調(diào) 104
7.3 Llama3 108
7.3.1 Llama3介紹 108
7.3.2 Llama3安裝 109
7.3.3 Chat應(yīng)用開(kāi)發(fā) 110
7.3.4 Llama3兼容API服務(wù)
開(kāi)發(fā) 113
7.3.5 Llama3微調(diào) 118
第8章 基于GLM-4的Function-calling應(yīng)用開(kāi)發(fā) 124
8.1 開(kāi)發(fā)要點(diǎn) 124
8.2 案例場(chǎng)景 125
8.3 關(guān)鍵原理 126
8.4 實(shí)現(xiàn)過(guò)程 128
8.4.1 環(huán)境安裝 128
8.4.2 源代碼 128
8.4.3 運(yùn)行 133
第9章 基于AgentScope的ReAct Agent應(yīng)用開(kāi)發(fā) 134
9.1 開(kāi)發(fā)要點(diǎn) 134
9.2 案例場(chǎng)景 134
9.3 關(guān)鍵原理 135
9.4 實(shí)現(xiàn)過(guò)程 138
9.4.1 環(huán)境安裝 138
9.4.2 源代碼 139
9.4.3 運(yùn)行 142
第10章 基于LangChain的任務(wù)驅(qū)動(dòng)Agent應(yīng)用開(kāi)發(fā) 143
10.1 開(kāi)發(fā)要點(diǎn) 143
10.2 案例場(chǎng)景 144
10.3 關(guān)鍵原理 144
10.3.1 應(yīng)用架構(gòu) 145
10.3.2 應(yīng)用運(yùn)行流程 145
10.3.3 應(yīng)用運(yùn)行示例 146
10.4 實(shí)現(xiàn)過(guò)程 149
10.4.1 環(huán)境安裝 149
10.4.2 源代碼 150
10.4.3 運(yùn)行 153
第11章 基于LangGraph的工作流Agent應(yīng)用開(kāi)發(fā) 155
11.1 開(kāi)發(fā)要點(diǎn) 155
11.2 案例場(chǎng)景 155
11.3 關(guān)鍵原理 156
11.3.1 基本概念 156
11.3.2 工作流定義 157
11.4 實(shí)現(xiàn)過(guò)程 158
11.4.1 環(huán)境安裝 158
11.4.2 源代碼 159
11.4.3 運(yùn)行 163
第12章 基于AutoGen的輔助編程Agent應(yīng)用開(kāi)發(fā) 164
12.1 開(kāi)發(fā)要點(diǎn) 164
12.2 案例場(chǎng)景 165
12.3 關(guān)鍵原理 165
12.4 實(shí)現(xiàn)過(guò)程 167
12.4.1 環(huán)境安裝 167
12.4.2 源代碼 168
12.4.3 運(yùn)行 171
第13章 基于LlamaIndex的RAG Agent綜合應(yīng)用開(kāi)發(fā) 173
13.1 開(kāi)發(fā)要點(diǎn) 173
13.2 案例場(chǎng)景 174
13.3 關(guān)鍵原理 174
13.3.1 索引建立 175
13.3.2 智體查詢 176
13.4 實(shí)現(xiàn)過(guò)程 176
13.4.1 環(huán)境安裝 176
13.4.2 源代碼 178
13.4.3 運(yùn)行 181
第14章 基于CrewAI的多角色Agent應(yīng)用開(kāi)發(fā) 182
14.1 開(kāi)發(fā)要點(diǎn) 182
14.2 案例場(chǎng)景 183
14.3 關(guān)鍵原理 183
14.3.1 應(yīng)用架構(gòu) 183
14.3.2 主要組件 184
14.3.3 流式會(huì)話實(shí)現(xiàn)原理 185
14.4 實(shí)現(xiàn)過(guò)程 186
14.4.1 環(huán)境安裝 186
14.4.2 源代碼 187
14.4.3 運(yùn)行 191
第15章 基于Qwen-Agent的多智體圖像應(yīng)用開(kāi)發(fā) 193
15.1 開(kāi)發(fā)要點(diǎn) 193
15.2 案例場(chǎng)景 194
15.3 關(guān)鍵原理 195
15.3.1 應(yīng)用架構(gòu) 195
15.3.2 關(guān)鍵技術(shù) 196
15.4 實(shí)現(xiàn)過(guò)程 198
15.4.1 環(huán)境安裝 198
15.4.2 源代碼 200
15.4.3 運(yùn)行 202
15.4.4 增強(qiáng)方案 202
第16章 基于CogVLM2的多模態(tài)Agent應(yīng)用開(kāi)發(fā) 204
16.1 開(kāi)發(fā)要點(diǎn)