Reinforcement Learning
모두의 RL) 1. Q-Learning Intro
Magin
2024. 11. 14. 15:37
728x90
먼저 Machine Learning에는 다음과 같이 나타낼 수 있씁니다.
지도학습 + 비지도학습 + 강화학습
저는 이제 학부때 카메라 센서를 주로 사용하여 YOLO를 통해서 지도학습쪽을 주로 공부하고 담당하였습니다.
때문에 강화학습은 아예 모르는 상황에서 최근에 공부를 시작하였고, 저의 목표는 강화학습을 통해서 로봇을 제어 해보고자 합니다.
강화학습 예시)
강화학습을 예시를 들어서 설명을 하자면 해당 RL 강의에서 다루는 Frozen Lake World 게임이 있습니다.
S: 시작점 F: 이동가능한 위치 H: 장애물 G: 목표지점
해당 게임을 한마디로 요약하면 다음과 같습니다.
어느 맵(Environment)에 펭귄(Agent)이 있고, 해당 위치(State)에서 랜덤하게 상,하,좌,우 4방향으로 움직(Action)이는데 움직이면서 점수(Reward)가 최고점이 되는 목표지점(Goal)까지 이동한다.
그래서 Agent는 현재 위치에서 Action을 취했을 때 Reward 최대가 되는 선택을 통해 움직이고 목표점에 도착하는 것을 반복함으로써 학습을 진행하는 것 입니다.
사람의 눈에는 쉬워 보이지만 컴퓨터 입장에서는 정보가 없기 때문에 힘든 문제입니다. 이제부터 강화학습이 어떻게 구성되어있는지 알아봅시다.
해당 게시물은 김성훈 교수님의 모두를 위한 RL 시리즈를 정리하는 내용을 담고 있습니다.
728x90