全部文章Ta的评论
- 强化学习(reinforcement learning, RL)与监督学习和无监督学习并称为及其学习的3类方法,用于描述和解决智能体在与环境交互过程中通过学习动作策略以达成回报最大化或实现特定目标的问题。本文主要讨论强化学习问题的主要求解方法、强化学习在实际任务应用中的难点与强化学习在大模型场景下的应用方向张峻伟2023-09-22220
- 强化学习(reinforcement learning, RL)与监督学习和无监督学习并称为及其学习的3类方法,用于描述和解决智能体在与环境交互过程中通过学习动作策略以达成回报最大化或实现特定目标的问题。本文主要介绍强化学习的发展、强化学习的框架结构与符号表示与强化学习的特性。张峻伟2023-09-222490
- 张峻伟2023-09-0770
共 3 条
- 1
页
没有更多了
个人简介
暂未填写公司和职务
暂未填写个人简介
暂未填写技能专长
暂未填写毕业院校和专业
个人成就
共发表过 3 篇文章
文章获得 0 次赞同
文章被浏览 278 次
获得 0 人关注
个人荣誉查看规则
暂未获得荣誉