题目内容
(请给出正确答案)
[单选题]
()是通过与环境的交互和奖惩机制,反复重演,完成最优策略的自主学习。
A.深度学习
B.监督/半监督学习
C.无监督学习
D.强化学习
如搜索结果不匹配,请 联系老师 获取答案
A.深度学习
B.监督/半监督学习
C.无监督学习
D.强化学习
第6题
A.监督学习
B.强化学习
C.弱化学习
D.无监督学习
为了保护您的账号安全,请在“上学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!