题目内容
(请给出正确答案)
[单选题]
概率规划问题描述可以通过马尔科夫决策过程进行说明,该决策过程的最基本模型可以看作是一个由()构成的四元组。
A.状态集合
B.行动集合
C.状态转移函数
D.行动序列
E.报酬函数
如搜索结果不匹配,请 联系老师 获取答案
A.状态集合
B.行动集合
C.状态转移函数
D.行动序列
E.报酬函数
第1题
A、系统所处的每步状态都是完全可观察的
B、环境状态可以是部分可观察的
C、状态间的转移可以有不确定性,用概率或概率分布来表示
D、马尔科夫性(或状态转移的无后效性)
第3题
A、状态、动作、转移概率、策略、折扣因子
B、状态、动作、转移概率、折扣因子、回报函数
C、状态、动作、输入、输出、回报函数
D、状态、动作、值、策略、回报函数
第6题
A、动态规划的核心是基本方程
B、对于同一个动态规划问题,应用顺序和逆序两种解法会得到相同的最优解
C、若动态规划问题的初始状态是已知的,一般采用顺序解法进行求解
D、最优性原理可以描述为策略具有的基本性质是无论初始状态和初始决策如何,对于前面决策所造成的某一状态而言,余下的决策序列必构成最优策略
为了保护您的账号安全,请在“上学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!