書單推薦
更多
新書推薦
更多

強化學習與隨機優(yōu)化

強化學習與隨機優(yōu)化

定  價:158 元

叢書名:大數(shù)據(jù)與數(shù)據(jù)科學專著系列

        

當前圖書已被 1 所學校薦購過!
查看明細

  • 作者:陳志平,劉嘉,徐宗本
  • 出版時間:2025/10/1
  • ISBN:9787508867519
  • 出 版 社:科學出版社
  • 中圖法分類:TP181 
  • 頁碼:410
  • 紙張:
  • 版次:1
  • 開本:B5
9
7
8
8
6
7
7
5
5
0
1
8
9

讀者對象:高等院校數(shù)學、計算機科學、人工智能、管理科學等專業(yè)的高年級本科生、研究生、教師及相關領域的科技工作者

本書旨在介紹近年來作者在強化學習和隨機優(yōu)化交叉領域的研究成果,主要內(nèi)容包括隨機優(yōu)化的定量穩(wěn)定性分析,求解多階段隨機優(yōu)化的新型情景樹生成、約減方法,機會約束規(guī)劃問題的模型轉換、凸逼近與求解,非平穩(wěn)強化學習的樣本復雜度與泛化能力分析,隨機優(yōu)化和強化學習的統(tǒng)一模型及其基本性質,風險厭惡馬氏決策過程與強化學習,分布魯棒機會約束馬氏決策過程及其轉換與求解算法設計,連續(xù)狀態(tài)集合、連續(xù)動作集合下無限智能體的連續(xù)時間平均場強化學習問題的性質與Actor-Critic型求解算法,以及強化學習在多期投資組合選擇中的應用。本書的目的是幫助讀者掌握如何應用強化學習或隨機優(yōu)化來處理不確定環(huán)境下的復雜動態(tài)決策問題、如何開展強化學習和隨機優(yōu)化的交叉研究,以便他們能夠盡快進入相應研究領域的前沿。

更多科學出版社服務,請掃碼獲取。
 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內(nèi)容