본문 바로가기

분류 전체보기

(35)
강화 학습 기초 - MDP(마르코프 결정 과정, Markov Decision Process) https://wikibook.co.kr/reinforcement-learning/ 파이썬과 케라스로 배우는 강화학습: 내 손으로 직접 구현하는 게임 인공지능 “강화학습을 쉽게 이해하고 코드로 구현하기” 강화학습의 기초부터 최근 알고리즘까지 친절하게 설명한다! ‘알파고’로부터 받은 신선한 충격으로 많은 사람들이 강화학습에 관심을 가지 wikibook.co.kr 해당 포스팅은 위의 책을 보고 정리한 내용입니다. 2장에서는 MDP와 벨만방정식이라는 소제목으로, 앞으로 강화학습에 쓰일 개념들을 짚고 넘어갑니다. 따라서 이 장의 목표는 수식에 익숙해지고, 각 수식을 각자만의 한 줄로 이해하고, 앞으로의 내용을 보는게 좋다고 생각합니다. 들어가기 전에 에이전트와 환경을 이해해야 합니다. 저번 포스팅에 언급 했어야..
강화 학습 개요 https://wikibook.co.kr/reinforcement-learning/ 파이썬과 케라스로 배우는 강화학습: 내 손으로 직접 구현하는 게임 인공지능 “강화학습을 쉽게 이해하고 코드로 구현하기” 강화학습의 기초부터 최근 알고리즘까지 친절하게 설명한다! ‘알파고’로부터 받은 신선한 충격으로 많은 사람들이 강화학습에 관심을 가지 wikibook.co.kr 해당 포스팅은 위의 책을 보고 정리한 내용입니다. 많은 강화학습 포스팅을 훑어 보면서, 위의 책을 본 사람들이 많은거 같아서 직접 읽어보기로 하였습니다. 우선, 1장은 강화학습을 가르쳐 준다기 보다는 소개에 가까운 장입니다. 그래서 기본 줄거리와 제가 읽으면서 중요하다고 생각하는 점, 그리고 생각한 점을 짧게 언급하려고 합니다. 먼저 "강화"라는 ..
첫 글 안녕하세요 저는 딥 러닝, 컴퓨터 비전을 공부하고 있습니다. 또, 현재는 유니티, 그래픽스, 그리고 강화학습도 관심이 있습니다. 많은 사람들의 포스팅을 보며 공부하면서, 또 아는 것에 감탄하고 부러워 하면서도 그런 사람들 만큼 자신이 배운 것을 잘 정리하지 않는 저를 돌아보게 되어 무작정 블로그를 만들었습니다. "다른 사람에게 설명 가능해야 진짜 아는거다" 라는 어디선가 들어본 말과 함께, 이 블로그에서 제가 공부한 것들을 정리해보려고 합니다. 제가 잘 정리한 글이 누군가에게 도움이 된다면 좋겠네요. 이 첫글이 다른 포스팅에 묻혀 까마득히 아래에 있기를 바라며.. 2021.12.29