![]() ![]() |
深度剖析DeepSeek大模型
全書共分為12章,首先介紹大模型的基礎(chǔ)知識(shí)與發(fā)展歷程,從神經(jīng)網(wǎng)絡(luò)的起源到大規(guī)模預(yù)訓(xùn)練模型的演化,再到Transformer、BERT與GPT等模型架構(gòu)的深入剖析,幫助讀者理解大模型的技術(shù)基石。其次詳細(xì)解析了DeepSeek-R1及其Zero版本在強(qiáng)化學(xué)習(xí)與模型架構(gòu)上的核心技術(shù),包括混合專家模型、動(dòng)態(tài)學(xué)習(xí)率調(diào)度、分布式訓(xùn)練及高效推理優(yōu)化策略等。再次聚焦于模型訓(xùn)練與開發(fā)實(shí)踐,介紹API調(diào)用、上下文拼接、模型微調(diào)、知識(shí)蒸餾等關(guān)鍵技術(shù),并結(jié)合DeepSeek實(shí)際案例展示其在數(shù)學(xué)推理、代碼生成等領(lǐng)域的應(yīng)用。最后著重探討了大模型在商業(yè)化落地場(chǎng)景中的高級(jí)應(yīng)用,如FIM補(bǔ)全、多輪對(duì)話、業(yè)務(wù)代碼自動(dòng)化生成以及基于云部署的智能推薦搜索系統(tǒng)等。
你還可能感興趣
我要評(píng)論
|