123,123

本書旨在介紹近年來作者在強化學習和隨機優(yōu)化交叉領域的研究成果，主要內(nèi)容包括隨機優(yōu)化的定量穩(wěn)定性分析，求解多階段隨機優(yōu)化的新型情景樹生成、約減方法，機會約束規(guī)劃問題的模型轉換、凸逼近與求解，非平穩(wěn)強化學習的樣本復雜度與泛化能力分析，隨機優(yōu)化和強化學習的統(tǒng)一模型及其基本性質，風險厭惡馬氏決策過程與強化學習，分布魯棒機會約束馬氏決策過程及其轉換與求解算法設計，連續(xù)狀態(tài)集合、連續(xù)動作集合下無限智能體的連續(xù)時間平均場強化學習問題的性質與Actor-Critic型求解算法，以及強化學習在多期投資組合選擇中的應用。本書的目的是幫助讀者掌握如何應用強化學習或隨機優(yōu)化來處理不確定環(huán)境下的復雜動態(tài)決策問題、如何開展強化學習和隨機優(yōu)化的交叉研究，以便他們能夠盡快進入相應研究領域的前沿。

更多科學出版社服務，請掃碼獲取。

你還可能感興趣

我要評論