強化學習

強化學習(Reinforcement Learning)介紹

Submitted by huzhenda on Sat, 07/14/2018 - 15:21

當前的機器學習算法可以分為3種:有監督的學習(Supervised Learning)、無監督的學習(Unsupervised Learning)和強化學習(Reinforcement Learning),結構圖如下所示:?

3.1

其他許多機器學習算法中學習器都是學得怎樣做,而RL是在嘗試的過程中學習到在特定的情境下選擇哪種行動可以得到最大的回報。在很多場景中,當前的行動不僅會影響當前的rewards,還會影響之后的狀態和一系列的rewards。RL最重要的3個特定在于:(1)基本是以一種閉環的形式;(2)不會直接指示選擇哪種行動(actions);(3)一系列的actions和獎勵信號(reward signals)都會影響之后較長的時間。?

冯仰妍破处门