목표
mab 문제정의 이해
bandit 알고리즘 기본 이해
학습 자료
Reinforcement Learning: An Introduction(chap 2) - Sutton
solutions
iamhectorotero/rlai-exercises
Q & A
이혜진
김준호