免费人妻中文不卡无码_日本精品爽爽van在线_久久精品国产99久久丝袜蜜桃_女强人被春药精油按摩bd电影

書單推薦
更多
新書推薦
更多

多智能體強化學習:基礎與現(xiàn)代方法 [德]斯特凡諾·V. 阿爾布萊希特 [希]菲利波斯·克里斯蒂安諾斯 [德]盧卡斯·舍費

 多智能體強化學習:基礎與現(xiàn)代方法 [德]斯特凡諾·V. 阿爾布萊希特 [希]菲利波斯·克里斯蒂安諾斯 [德]盧卡斯·舍費

定  價:109 元

        

當前圖書已被 1 所學校薦購過!
查看明細

  • 作者:[德]斯特凡諾·V. 阿爾布萊希特(Stefano V. Albrecht)[希]菲利波斯·克里斯蒂安諾斯(Filippos Christianos)[德]盧卡斯·舍費爾(Lukas Sch?fer)
  • 出版時間:2025/5/1
  • ISBN:9787111776871
  • 出 版 社:機械工業(yè)出版社
  • 中圖法分類:TP18 
  • 頁碼:
  • 紙張:膠版紙
  • 版次:
  • 開本:16開
9
7
7
8
7
7
6
1
8
1
7
1
1
多智能體強化學習(Multi-Agent Reinforcement Learning, MARL)是機器學習中的一個領域,研究多個智能體如何在共享環(huán)境中學習最優(yōu)的交互方式。這一領域在現(xiàn)代生活中有著廣泛的應用,包括自動駕駛、多機器人工廠、自動化交易和能源網(wǎng)絡管理等。 本書是一部系統(tǒng)闡述多智能體強化學習理論與技術的權威著作,清晰而嚴謹?shù)亟榻B了MARL的模型、解決方案概念、算法思想、技術挑戰(zhàn)以及現(xiàn)代方法。書中首先介紹了該領域的基礎知識,包括強化學習理論和算法的基礎、交互式博弈模型、博弈中的不同解決方案概念以及支撐MARL研究的算法思想。隨后,書中詳細介紹了利用深度學習技術的現(xiàn)代MARL算法,涵蓋集中訓練與分散執(zhí)行、價值分解、參數(shù)共享和自博弈等思想。本書還附帶了一個用Python編寫的MARL代碼庫,其中包括自包含且易于閱讀的MARL算法實現(xiàn)。 本書技術內(nèi)容以易于理解的語言解釋,并通過大量示例進行說明,既為初學者闡明了MARL的概念,也為專業(yè)的讀者提供了高層次的見解。
 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內(nèi)容