machine learning
-
모두의 RL) 1. Dummy Q-Learning(table)Reinforcement Learning 2024. 11. 15. 10:15
이전 포스팅을 통해서 강화학습에 대해서 간단하게 배웠습니다. Q(s1, Left): 0 Q(s1, Right): 0.5 Q(s1, Up): 0 Q(s1, Down): 0.3 위 수식은 s1이라는 상태에서 움직였을 때 Reward 값이 적혀있다.그리고 Agent는 현재 상태에서 Q가 큰값으로 이동 할 것이기 때문에 Q(s1, Right)이고Q가 최댓값이 되게하는 변수가 Right에 해당되니다. 여기서 파이는 Policy를 의미하고 *가 붙은 것은 Optimal 된 값을 나타냅니다. Q 학습 로직현재 상황 (무조건 믿어라!!)현재 위치는 sa의 행동을 했을 때, 위치는 s'a의 행동을 했을 때, r의 보상을 받는다.Q(s', a')은 알고있다.Q(s', a')를 통해서 Q(s, a)는 어떻게 나타낼 수..
-
[Coursera] 1. Supervised Learning (Andrew Ng)지식저장소 2023. 7. 6. 22:15
*본 글은 Coursera의 Andrew Ng 머신러닝 강의를 보고 정리한 내용입니다. (처음 사용하는 사용자라면 7일간 무료로 들을 수 있습니다.) Supervised Machine Learning: Regression and Classification In the first course of the Machine Learning Specialization, you will: • Build machine learning models in Python using popular machine learning ... 무료로 등록하십시오. www.coursera.org 1. What is Machine Learing? - 해당 강의의 시작은 "머신러닝이란 무엇인가?"로 시작한다. Arthur Samuel(아서..