홈
태그
방명록

분류 전체보기 (69)

ABOUT ME

-

트위터
인스타그램

Today: -

Yesterday: -

Total: -

Magin-playground Magin-playground

컨텐츠 검색 블로그 내 검색

machine learning

모두의 RL) 1. Dummy Q-Learning(table)
Reinforcement Learning 2024. 11. 15. 10:15

이전 포스팅을 통해서 강화학습에 대해서 간단하게 배웠습니다. Q(s1, Left): 0 Q(s1, Right): 0.5 Q(s1, Up): 0 Q(s1, Down): 0.3 위 수식은 s1이라는 상태에서 움직였을 때 Reward 값이 적혀있다.그리고 Agent는 현재 상태에서 Q가 큰값으로 이동 할 것이기 때문에 Q(s1, Right)이고Q가 최댓값이 되게하는 변수가 Right에 해당되니다. 여기서 파이는 Policy를 의미하고 *가 붙은 것은 Optimal 된 값을 나타냅니다. Q 학습 로직현재 상황 (무조건 믿어라!!)현재 위치는 sa의 행동을 했을 때, 위치는 s'a의 행동을 했을 때, r의 보상을 받는다.Q(s', a')은 알고있다.Q(s', a')를 통해서 Q(s, a)는 어떻게 나타낼 수..
[Coursera] 1. Supervised Learning (Andrew Ng)
지식저장소 2023. 7. 6. 22:15

*본 글은 Coursera의 Andrew Ng 머신러닝 강의를 보고 정리한 내용입니다. (처음 사용하는 사용자라면 7일간 무료로 들을 수 있습니다.) Supervised Machine Learning: Regression and Classification In the first course of the Machine Learning Specialization, you will: • Build machine learning models in Python using popular machine learning ... 무료로 등록하십시오. www.coursera.org 1. What is Machine Learing? - 해당 강의의 시작은 "머신러닝이란 무엇인가?"로 시작한다. Arthur Samuel(아서..

이전

1

다음

250x250

인기포스트

ABOUT ME

LINK

ADMIN

admin 글쓰기

Designed by Tistory.

티스토리툴바