[개념만] Hierarchical Deep Reinforcement Learning

이미지 처리 관련한 강화학습 논문(Video Captioning via Hierarchical Reinforcement Learning, CVPR 2018)을 읽던 중 모르는 개념이 나와 일단 기록합니다.

Hierarchical Deep Reinforcement Learning이라는 개념인데 큰 목표와 작은 목표로 나누어 agent를 학습시키는 것 같습니다. 작은 목표가 모이면 큰 목표가 되는것이고 그 큰 목표를 실행하는 과정들을 통해 최종적으로 목표하는 action이나 policy를 학습하는 것이죠.

어떤 문제가 하나의 큰 목표가 아니라 더 세분화 될때 사용하면 좋은 개념인거 같습니다.

나중에 리뷰해보도록 해야겠습니다.

논문:

한국어 리뷰:

Hierarchical Deep Reinforcement Learning (HDQN)

본 포스팅은 기본적은 강화학습인 Q-learning과 DQN(Deep Q-network)에 대해 알고 있으셔야 읽기 수월합니다. Q-learning과 DQN에 대한 내용은 김성교수님의 모두를 위한 RL 강의를 참고하시기 바랍니다. (http

bluediary8.tistory.com

좋은 포스팅 감사합니다.

'강화 학습' 카테고리의 다른 글

강화 학습 - A3C(Asynchronous Advantage Actor-Critic) (0)	2022.01.14
강화 학습 - A2C, Continuous A2C (2)	2022.01.13
강화 학습 - DQN (1)	2022.01.12
강화 학습 - 정책 기반(Policy-based) 강화 학습, REINFORCE 알고리즘 (0)	2022.01.11
강화 학습 - 딥 살사(Deep SARSA) 알고리즘 (0)	2022.01.10

공부Dragon

[개념만] Hierarchical Deep Reinforcement Learning

'강화 학습' 카테고리의 다른 글

티스토리툴바

[개념만] Hierarchical Deep Reinforcement Learning

'강화 학습' 카테고리의 다른 글

'강화 학습' Related Articles

티스토리툴바