人工智能简介:基于知识的系统
代理程序是实现从感知到操作的映射的程序。对于简单的代理,这种查看问题的方式就足够了。对于代…
历史研究记录
代理程序是实现从感知到操作的映射的程序。对于简单的代理,这种查看问题的方式就足够了。对于代…
如果代理人没有世界模型,也就是说,当它不知道可能的行为导致哪种状态时,基于对可能的后继状态…
到目前为止,对于Q学习,仅给出了粗略的算法模式。特别缺乏的是每次选择起始状态的描述以及…
强化学习的实际应用已经多次展示过。从大量的例子中,我们将简要介绍一个小的选择。 TD-ga…
尽管近年来取得了成功,但强化学习仍然是人工智能研究的一个活跃领域,尤其是因为即使是目前已知…
今天,我们可以使用运行良好且已建立的学习算法来训练我们的机器。然而,人类培训师或开发人…
到目前为止所描述的所有学习算法 – 除了聚类算法 – 都属于监督学…
∈ SS 如第260 页的图10.4 所示,我们区分了代理及其环境。在时间t,包括代理及其…
找到成功政策的最简单的可能性是所有政策的组合,如第7章所述。6.然而,即使在简单的例子…
在列举所有策略的天真方法中,执行了大量冗余工作,因为许多策略在很大程度上是相同的。他们…