강화학습/딥러닝_강화학습 주식투자_11 배경이론 2 : 강화학습이란? (1) 2.1. 강화학습의 기초가 된 마르코프 의사결정 과정강화학습(reinforcement learning)은 머신러닝 기법 중 한 가지로서, 어떠한 환경에서 어떠한 행동을 했을 때 그것이 잘된 행동인지를 나중에 판단하고 보상 (또는 벌칙)을 줌으로써 스스로 시행착오를 해 가며 학습하게 하는 분야이다.강화학습에는 두 가지 구성 요소로 환경과 에이전트가 있다.에이전트는 특정 환경에서 행동을 결정하고 환경은 그 결정에 대한 보상(reward)을 내린다.이 보상은 행동 즉시 결정되기보다는 여러 행동들을 취한 후에 한꺼번에 결정되는 경우가 많다.특정 행동을 취했을 때 바로 그 행동에 대한 평가를 내릴 수 없는 경우가 많기 때문이다.강화학습은 딥러닝과 밀접한 관계가 있다.에이전트가 행동을 결정하고 환경이 주는 보상으로.. 2025. 1. 22. 이전 1 다음