联系客服1
联系客服2

深度强化学习 ( DQN )基本原理与AI项目实战,全套视频教程学习资料通过百度云网盘下载

0
回复
192
查看
打印 上一主题 下一主题
[复制链接]
  • TA的每日心情
    开心
    2024-9-19 21:14
  • 签到天数: 757 天

    [LV.10]以坛为家III

    7335

    主题

    8751

    帖子

    131万

    积分

    管理员

    Rank: 9Rank: 9Rank: 9

    积分
    1312455
    楼主
    发表于 2021-4-18 04:20:48 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

    资源详情


    强化学习是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯忄生行为。
    在强化学习的世界里,算法称之为Agent,它与环境发生交互,Agent从环境中获取状态(state),并决定自己要做出的动作(action).环境会根据自身的逻辑给Agent予以奖励(reward)。奖励有正向和反向之分。比如在游戏中,每击中一个敌人就是正向的奖励,掉血或者游戏结束就是反向的奖励。
    【课程内容】强化学习简介强化学习基本概念
    马尔科夫决策过程
    Bellman方程
    值迭代求解
    代码实战求解过程
    QLearning基本原理
    QLearning迭代计算实例
    QLearning迭代效果
    求解流程详解
    DeepQnetwork原理
    DQN网络细节
    DQN网络参数配置
    搭建DQN网络模型
    DQN卷积操作定义
    数据预处理
    实验阶段数据存储
    实现训练模块
    Debug解读训练代码
    完整代码流程分析
    DQN效果演示




    游客,如果您要查看本帖隐藏内容请回复
    收藏
    收藏0
    分享
    分享
    支持
    支持0
    反对
    反对0
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    学习课程!一站搞定!
    学途无忧VIP会员群

    973849140

    周一至周日9:00-23:00

    反馈建议

    1227072433@qq.com 在线QQ咨询

    扫描二维码关注我们

    学途无忧!为学习谋坦途,为会员谋福利!|网站地图