목표
mab 문제정의 이해
bandit 알고리즘 기본 이해
학습 자료
Reinforcement Learning: An Introduction(chap 2) - Sutton
solutions
iamhectorotero/rlai-exercises
랩업 자료
BRS_LAB_Week4_define_mab_problem_2.pdf