图书标签: 机器学习 人工智能 Reinforce multi-agent 算法 博弈 计算机科学 科普
发表于2024-11-22
多智能体机器学习--强化学习方法 pdf epub mobi txt 电子书 下载 2024
本书主要介绍了多智能体机器人强化学习的相关内容。全书共6章,首先介绍了几种常用的监督式学习方法,在此基础上,介绍了单智能体强化学习中的学习结构、值函数、马尔科夫决策过程、策略迭代、时间差分学习、Q学习和资格迹等概念和方法。然后,介绍了双人矩阵博弈问题、多人随机博弈学习问题,并通过3种博弈游戏详细介绍了纳什均衡、学习算法、学习自动机、滞后锚算法等内容,并提出LR-I滞后锚算法和指数移动平均Q学习算法等,并进行了分析比较。接下来,介绍了模糊系统和模糊学习,并通过仿真示例详细分析算法。后,介绍了群智能学习进化以及性格特征概念和应用。全书内容丰富,重点突出。
Howard M.Schwartz 博士,在加拿大魁北克蒙特利尔的麦吉尔大学获得工学学士学位,在美国马萨诸塞州剑桥麻省理工学院获得硕士和博士学位,现为加拿大渥太华卡尔顿大学系统与计算机工程系的教授,研究领域包括自适应和智能控制系统、机器人、机器学习、多智能体学习、系统辨识和状态估计。
介绍了几个微分博弈经典例子,这方面的研究网上资料较少;另外看原文可能更易于理解一些,书中还是有一部分错误的
评分介绍了几个微分博弈经典例子,这方面的研究网上资料较少;另外看原文可能更易于理解一些,书中还是有一部分错误的
评分排版不好看。尤其是伪代码部分,不仅写得简略、字体和字号又选的不好。至于内容……反正什么都是纳什均衡呗。
评分介绍了几个微分博弈经典例子,这方面的研究网上资料较少;另外看原文可能更易于理解一些,书中还是有一部分错误的
评分排版不好看。尤其是伪代码部分,不仅写得简略、字体和字号又选的不好。至于内容……反正什么都是纳什均衡呗。
评分
评分
评分
评分
多智能体机器学习--强化学习方法 pdf epub mobi txt 电子书 下载 2024