圖書標籤: 強化學習 人工智能 機器學習 算法 計算科學 深度學習 Python
发表于2024-05-29
深入淺齣強化學習:原理入門 pdf epub mobi txt 電子書 下載 2024
《深入淺齣強化學習:原理入門》用通俗易懂的語言深入淺齣地介紹瞭強化學習的基本原理,覆蓋瞭傳統的強化學習基本方法和當前炙手可熱的深度強化學習方法。開篇從最基本的馬爾科夫決策過程入手,將強化學習問題納入到嚴謹的數學框架中,接著闡述瞭解決此類問題最基本的方法——動態規劃方法,並從中總結齣解決強化學習問題的基本思路:交互迭代策略評估和策略改善。基於這個思路,分彆介紹瞭基於值函數的強化學習方法和基於直接策略搜索的強化學習方法。最後介紹瞭逆嚮強化學習方法和近年具有代錶性、比較前沿的強化學習方法。
除瞭係統地介紹基本理論,書中還介紹瞭相應的數學基礎和編程實例。因此,《深入淺齣強化學習:原理入門》既適閤零基礎的人員入門學習、也適閤相關科研人員作為研究參考。
適閤入門學習
評分是不錯的survey,然後再去看論文
評分彆用這個入門!入門概念不清晰!推薦去看吳恩達和david silver的課程。 優點是後麵的數學證明比較全。有個問題,發現主綫和配圖公式以及例子幾乎照搬ucl的ppt.
評分從馬爾科夫決策過程MDP,到決策/動作狀態轉移概率矩陣已知時的基於模型的動態規劃方法,轉移概率矩陣未知的基於無模型的強化學習方法。無論轉移概率矩陣是否已知,都需要策略迭代算法/值迭代算法/策略搜索算法。就像強化學習(或增強學習)的名字暗示的那樣,其中還包括bootstrapping算法。無模型的強化學習中的濛特卡洛MC算法/時間差分TD算法。連續空間下的值函數逼近算法。順帶補充瞭一些統計/優化/gym/TensorFlow/Python/強化學習前沿等內容。好書推薦。
評分簡單堆砌公式,本科生想看懂怕是吃力
首先请把0基础数学这几个字删掉,概率论,线性代数,微积分是至少的,里面的介绍只能说聊胜于无。虽然对我没影响了 github代码维护极差,两年没更新第一个demo都跑不通,issue也不看。您倒是关心一下后续啊喂 简单的部分一再重复,复杂的部分一语带过。前5步看的挺开心,到最后...
評分个人觉得写得很垃圾。即便作者是我同校毕业的师兄,符号丢三落四。完全不知所然。完全不像是一个博后写的书嘛。心疼我的70块钱。看了开头2章真心觉得还不如看博客。个人建议,博文视点ai系列的书,大家买的时候慎重吧。而且我朋友说这本书大部分都是copy一份课程的东西,copy我...
評分个人觉得写得很垃圾。即便作者是我同校毕业的师兄,符号丢三落四。完全不知所然。完全不像是一个博后写的书嘛。心疼我的70块钱。看了开头2章真心觉得还不如看博客。个人建议,博文视点ai系列的书,大家买的时候慎重吧。而且我朋友说这本书大部分都是copy一份课程的东西,copy我...
評分首先请把0基础数学这几个字删掉,概率论,线性代数,微积分是至少的,里面的介绍只能说聊胜于无。虽然对我没影响了 github代码维护极差,两年没更新第一个demo都跑不通,issue也不看。您倒是关心一下后续啊喂 简单的部分一再重复,复杂的部分一语带过。前5步看的挺开心,到最后...
評分个人觉得写得很垃圾。即便作者是我同校毕业的师兄,符号丢三落四。完全不知所然。完全不像是一个博后写的书嘛。心疼我的70块钱。看了开头2章真心觉得还不如看博客。个人建议,博文视点ai系列的书,大家买的时候慎重吧。而且我朋友说这本书大部分都是copy一份课程的东西,copy我...
深入淺齣強化學習:原理入門 pdf epub mobi txt 電子書 下載 2024