여기 설명이 최고
그냥 softmax한 값($y$)에 음수 취한것. $= -log(y)$
loss란 unhappiness와 같다는 설명이 직관적이다. 낮을수록 좋은것.
$-log(y)$는 $y$가 $0$에 가까울수록 값이 커지므로 좋지 않다. $1$에 가까울수록 좋다.
그래서 멀티클래스에서 맞는 클래스의 값(확률)만 취하면됨 : 이게 무슨소리냐면 아래 그림과 같다. 위에 링크한 페이지에서 퍼온것이다.
깔끔한 일러스트보다 더 보기좋은듯? 훌륭하다. Great!