Cost function 은 예측값과 실제 결과 값의 차이를 나타내는 함수입니다.
예측을 하는 데이터를 바꾸면서 실제 결과 값과 차이를 그래프로 나타내어 최소화 된 값을 구한는것이 cost function입니다.
Cost function 을 이용하여 Logistic Regression 에 해당하는 그래프를 그리면 아래와 같이 U 자 가 아닌 굴곡이 가득한 그래프가 보일것이다.
Gredient descent algorithm 을 통해 최소값을 구하는데 굴곡점에서 컴퓨터는 최소화된 값이라 생각하여 학습을 멈추게 될것입니다. 따라서 가설을 바꾸어 cost function 도 New cost function for logistic 이 생겨났습니다.
cost function 은 데이터에 대한 평균을 나태내는데 c라는 함수에 대한 평균으로 나타낼수 있습니다.
Logistic Regression 의 경우 바로 이 C라는 함수가 달라지는데 결과 값인 y 에 따라 다른 함수를 대입시킵니다.
log 에 대한 값이 들어간 이유는 e에 대한 값 처리를 하기 위해섭니다.
실제 결과값은 0과 1사이에만 가질수있습니다.
실제값이 1일때 그래프를 그려보게 되면 예측밧이 1에 가까워질수록 cost function 의 값은 집니다. 반대인경우 0에 가까워지면 cost function 의 값이 무한대로 증가되어 예측이 틀렸다는것을 보여줍니다.
y 가 0일때도 마찬가지입니다.
간혹가다 특별한 경우 예를 들어 병원 에서 암진단 관련으로 나올때는 평균값을 0.5가 아닌 0.4혹은 다른 평균값을 낼수 있습니다.
예측값을 0.4로 낮추었을때
'ML > 머신러닝' 카테고리의 다른 글
Hierarchical clustering 소개 (0) | 2022.07.20 |
---|---|
머신러닝 - logistic classificaction (0) | 2022.06.20 |
머신러닝 Minimize cost (0) | 2022.06.20 |
머신 러닝 - 기본 용어 및 개념 (0) | 2022.06.16 |