본문 바로가기

강화 학습

[개념만] Hierarchical Deep Reinforcement Learning

이미지 처리 관련한 강화학습 논문(Video Captioning via Hierarchical Reinforcement Learning, CVPR 2018)을 읽던 중 모르는 개념이 나와 일단 기록합니다. 

Hierarchical Deep Reinforcement Learning이라는 개념인데 큰 목표와 작은 목표로 나누어 agent를 학습시키는 것 같습니다. 작은 목표가 모이면 큰 목표가 되는것이고 그 큰 목표를 실행하는 과정들을 통해 최종적으로 목표하는 action이나 policy를 학습하는 것이죠.

어떤 문제가 하나의 큰 목표가 아니라 더 세분화 될때 사용하면 좋은 개념인거 같습니다.

 

나중에 리뷰해보도록 해야겠습니다.

 

논문:

한국어 리뷰:

 

Hierarchical Deep Reinforcement Learning (HDQN)

본 포스팅은 기본적은 강화학습인 Q-learning과 DQN(Deep Q-network)에 대해 알고 있으셔야 읽기 수월합니다. Q-learning과 DQN에 대한 내용은 김성교수님의 모두를 위한 RL 강의를 참고하시기 바랍니다. (http

bluediary8.tistory.com

좋은 포스팅 감사합니다.