![]() ![]() |
大模型核心原理與企業(yè)落地實踐
本書分兩大篇。第1篇原理篇 (第1、2章); 嘗試引導(dǎo)讀者共同探索和揭秘研發(fā)領(lǐng)域大模型背后的核心原理, 以使讀者“既知其然, 又知其所以然”, 并為后續(xù)章節(jié)的學習打下堅實的基礎(chǔ)。從概率、最優(yōu)化等基礎(chǔ)理論入手, 進而深入淺出地闡述Transformer、神經(jīng)元等大模型的核心組成元素, 以及評估方法、數(shù)據(jù)工程建設(shè)等通用能力的建設(shè)。針對技術(shù)細節(jié), 采用通俗易懂的行文風格, 并輔以大量的圖表和數(shù)據(jù), “零基礎(chǔ)”的讀者也可以高效地學習。第2篇應(yīng)用實踐篇 (第3-8章), 產(chǎn)業(yè)界最新實踐成果的總結(jié)。選取代碼生成、代碼轉(zhuǎn)換、知識問答、推理加速、運維運營等研發(fā)大模型領(lǐng)域的高頻業(yè)務(wù)作為剖析對象, 詳細展示作者在針對這些問題時的端到端思考, 包括設(shè)計理念、關(guān)鍵技術(shù)瓶頸、解決方案及落地結(jié)果等。
你還可能感興趣
我要評論
|