张峻伟-作者主页-天翼云开发者社区 - 天翼云

张峻伟

3 文章|0 获赞|0 粉丝|323 浏览

社区专栏视频问答关注

全部文章Ta的评论

浅谈强化学习及其大模型场景下的应用（2/2）
强化学习（reinforcement learning, RL）与监督学习和无监督学习并称为及其学习的3类方法，用于描述和解决智能体在与环境交互过程中通过学习动作策略以达成回报最大化或实现特定目标的问题。本文主要讨论强化学习问题的主要求解方法、强化学习在实际任务应用中的难点与强化学习在大模型场景下的应用方向
AI 计算
张峻伟
2023-09-22
24
0
浅谈强化学习及其大模型场景下的应用（1/2）
强化学习（reinforcement learning, RL）与监督学习和无监督学习并称为及其学习的3类方法，用于描述和解决智能体在与环境交互过程中通过学习动作策略以达成回报最大化或实现特定目标的问题。本文主要介绍强化学习的发展、强化学习的框架结构与符号表示与强化学习的特性。
AI 计算
张峻伟
2023-09-22
292
0
kubenetes对象之Ingress
Ingress对象基本原理、组件部署与使用。
容器微服务
张峻伟
2023-09-07
7
0

共 3 条前往

页

没有更多了

个人简介

暂未填写公司和职务

暂未填写个人简介

暂未填写技能专长

暂未填写毕业院校和专业

个人成就

共发表过 3 篇文章

文章获得 0 次赞同

文章被浏览 323 次

获得 0 人关注

个人荣誉查看规则

暂未获得荣誉