在本章中,您将详细学习使用 Python 进行 AI 强化学习的概念。
这种类型的学习被用来加强或加强基于评论者信息的网络。 也就是说,在强化学习下训练的网络从环境中获得一些反馈。 但是,反馈是评价性的,并且不像监督式学习的情况那样具有启发性。 基于这种反馈,网络将对权重进行调整以获得更好的评论信息。
这个学习过程类似于监督学习,但我们可能拥有的信息非常少。 下图给出了强化学习的框图 -