深度强化学习 ( DQN )基本原理与AI项目实战,全套视频教程学习资料通过百度云网盘下载

admin · 发表于 2021-4-18 04:20:48

资源详情

强化学习是机器学习中的一个领域，强调如何基于环境而行动，以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论，即有机体如何在环境给予的奖励或惩罚的刺激下，逐步形成对刺激的预期，产生能获得最大利益的习惯忄生行为。
在强化学习的世界里，算法称之为Agent，它与环境发生交互，Agent从环境中获取状态（state），并决定自己要做出的动作（action）.环境会根据自身的逻辑给Agent予以奖励（reward）。奖励有正向和反向之分。比如在游戏中，每击中一个敌人就是正向的奖励，掉血或者游戏结束就是反向的奖励。
【课程内容】强化学习简介强化学习基本概念
马尔科夫决策过程
Bellman方程
值迭代求解
代码实战求解过程
QLearning基本原理
QLearning迭代计算实例
QLearning迭代效果
求解流程详解
DeepQnetwork原理
DQN网络细节
DQN网络参数配置
搭建DQN网络模型
DQN卷积操作定义
数据预处理
实验阶段数据存储
实现训练模块
Debug解读训练代码
完整代码流程分析
DQN效果演示

游客，如果您要查看本帖隐藏内容请回复

客服电话

电子邮件

深度强化学习 ( DQN )基本原理与AI项目实战,全套视频教程学习资料通过百度云网盘下载

关于我们

帮助中心

新手指南

学途无忧VIP会员群

973849140

反馈建议