免费人妻中文不卡无码_日本精品爽爽van在线_久久精品国产99久久丝袜蜜桃_女强人被春药精油按摩bd电影

書單推薦
更多
新書推薦
更多

Lessons from alphazero for optimal, model predictive, and adaptive control

Lessons from alphazero for optimal, model predictive, and adaptive control

定  價(jià):79 元

叢書名:國(guó)際知名大學(xué)原版教材

        

  • 作者:Dimitri P. Bertsekas
  • 出版時(shí)間:2025/4/1
  • ISBN:9787302684718
  • 出 版 社:清華大學(xué)出版社
  • 中圖法分類:TP181 
  • 頁(yè)碼:xiv, 227頁(yè)
  • 紙張:
  • 版次:影印版
  • 開本:24cm
9
7
6
8
8
7
4
3
7
0
1
2
8
本書構(gòu)建了近似動(dòng)態(tài)規(guī)劃和強(qiáng)化學(xué)習(xí)的新的理論框架, 簡(jiǎn)潔但雄心勃勃。這一框架以離線訓(xùn)練和在線學(xué)習(xí)這兩個(gè)算法為中心, 彼此獨(dú)立又通過(guò)牛頓法有機(jī)融合。當(dāng)今新一代人工智能技術(shù)發(fā)展絢麗多彩。在看似紛繁復(fù)雜的數(shù)據(jù)與算法表象之下, 其實(shí)蘊(yùn)藏著簡(jiǎn)潔而美妙的規(guī)律。通過(guò)本書的學(xué)習(xí), 讀者將能體會(huì)經(jīng)典優(yōu)化控制理論在分析理解當(dāng)代強(qiáng)化學(xué)習(xí)算法性能中的強(qiáng)大威力, 更能領(lǐng)悟到以阿爾法零為代表的新一代算法浪潮對(duì)經(jīng)典理論提供的新的發(fā)展機(jī)遇。
 你還可能感興趣
 我要評(píng)論
您的姓名   驗(yàn)證碼: 圖片看不清?點(diǎn)擊重新得到驗(yàn)證碼
留言內(nèi)容