- 이진 분류를 처리할 때 (Binary classification), - Sigmoid Function ((-INF, INF) → (0, 1)) - Binary Cross-Entropy Loss (Log Loss) ((0, 1) → [0, INF)) - 다중 분류를 처리할 때 (Multi-class classification), - Softmax Function ((-INF, INF) → (0, 1)) - Negative Log-Likelihood ((0, 1) → (INF, 0]) - 따라서, 몇 개의 요소로 분류를 하는 지에 따라, 사용하는 함수가 다름을 이해하자. - Sigmoid는 Softmax의 특수 케이스로 클래스 갯수만 2개일 뿐 완전히 같은 연산을 수행한다. - 활성화 함수 이후에 손실 ..