이미지 처리 관련한 강화학습 논문(Video Captioning via Hierarchical Reinforcement Learning, CVPR 2018)을 읽던 중 모르는 개념이 나와 일단 기록합니다.
Hierarchical Deep Reinforcement Learning이라는 개념인데 큰 목표와 작은 목표로 나누어 agent를 학습시키는 것 같습니다. 작은 목표가 모이면 큰 목표가 되는것이고 그 큰 목표를 실행하는 과정들을 통해 최종적으로 목표하는 action이나 policy를 학습하는 것이죠.
어떤 문제가 하나의 큰 목표가 아니라 더 세분화 될때 사용하면 좋은 개념인거 같습니다.
나중에 리뷰해보도록 해야겠습니다.
논문:
한국어 리뷰:
좋은 포스팅 감사합니다.
'강화 학습' 카테고리의 다른 글
강화 학습 - A3C(Asynchronous Advantage Actor-Critic) (0) | 2022.01.14 |
---|---|
강화 학습 - A2C, Continuous A2C (2) | 2022.01.13 |
강화 학습 - DQN (0) | 2022.01.12 |
강화 학습 - 정책 기반(Policy-based) 강화 학습, REINFORCE 알고리즘 (0) | 2022.01.11 |
강화 학습 - 딥 살사(Deep SARSA) 알고리즘 (0) | 2022.01.10 |