Hierarchical clustering 소개
2022. 7. 20. 14:22
ML/머신러닝
hierarchical clustering 계층적 군집화(Hierarchical Clustering) 개체들을 가까운 집단부터 순차적/계층적으로 차근차근 묶어 나가는 방식 유사한 개체들이 결합되는 dendogram 을 통해 시각화 가능 사전에 군집의 개수를 정하지 않아도 수행가능 모든 개체들 사이의 거리에 대한 유사도 행렬 계산 거리가 인접한 관측치끼리 cluster형성 유사도 행렬 update 학습 과정 Hierarchical Clustering 를 수행하려면 모든 개체들 간 거리(distance)나 유사도(similarity)가 이미 계산되어 있어야 합니다. 이표는 A와 D의 거리가 가까워서 cluestring 을 한다. AD군집과 가장 가까운 거리는 C라는것이라고 해서 묶어서 새로운 cluester..
머신 러닝 - cost Function
2022. 6. 20. 15:04
ML/머신러닝
Cost function 은 예측값과 실제 결과 값의 차이를 나타내는 함수입니다. 예측을 하는 데이터를 바꾸면서 실제 결과 값과 차이를 그래프로 나타내어 최소화 된 값을 구한는것이 cost function입니다. Cost function 을 이용하여 Logistic Regression 에 해당하는 그래프를 그리면 아래와 같이 U 자 가 아닌 굴곡이 가득한 그래프가 보일것이다. Gredient descent algorithm 을 통해 최소값을 구하는데 굴곡점에서 컴퓨터는 최소화된 값이라 생각하여 학습을 멈추게 될것입니다. 따라서 가설을 바꾸어 cost function 도 New cost function for logistic 이 생겨났습니다. cost function 은 데이터에 대한 평균을 나태내는데 c..
머신러닝 - logistic classificaction
2022. 6. 20. 14:54
ML/머신러닝
logistic classification - Classification 알고리즘 중에서도 가장 정확도가 높은 알고리즘으로 알려져있습니다. 그중에서도 Binary Classification 으로 둘중에 무엇에 속하는지를 판별하는 알고리즘으로 생각할수있다. 대표적인 예시로 받은 이메일이 스팸인지 아닌지 판별이 필요하다. 또한 페이스북에서 나의 친구들의 모든 타임라인을 보여주는것이 아닌, 내가 좋아요 혹은 특정정보를 Follow 하여 생긴 것들을 판별하여 나의 피드에 띄어주는 학습 그리고 이때 쓰이는것이 encoing 할때 0 과 1이 사용된다. Binary Classfication 으로 값을 구할떄 linear regression 으로 구할수도있다. 단 단점이 너무 극명해진다. 0~ 1 사이에 0.5를 기..
머신러닝 Minimize cost
2022. 6. 20. 14:43
ML/머신러닝
Cost Function 앞서 배운것 linear Regression 의 목표는 우리가 가지고 있는 W,b를 가지고 cost minimize 하는것이다. 간단한 hypothesis 를 만드는 식을보자 그러다면 cost(W) 는 어떻게 보일까? Gradient descent algorithm 수식: 최소화 하는데 있어서 가장 많이 쓰이는 알고리즘이다. 주어진 cost function 에 minimize 를 사용한다. 아무지점이나 시작할수 있다. W가 0일때 시작할수도 있다. W를 조금 바꾸면서 cost 를 줄일수있다. 그 과정을 반복하는것이다. 어떠한 점에서 시작하는 간에 최저점에 도달할수있는 과정이다. Convex function : cost(w,b) 식으로 쓴다면 어느 시점에 시작을 하더라도 항상 답을..
머신 러닝 - 기본 용어 및 개념
2022. 6. 16. 18:08
ML/머신러닝
Machine Learning - 기계를 스스로 학습 시키는것 Supervised learning(지도학습) data(데이터) 와 label(값) 으로 학습 시킨 머신러닝 ex) 사람들이 고양이가 있는 사진(data) 에 고양이라고표시(label) 을 넣어주어 학습시킨다(엄청나게 많은 사진이 필요함) Unsupervised learning (비지도학습) label(값)이 없는 상황속에서 데이터만 보고 스스로 학습시키는것 ex) 각종의 뉴스(정치,경제,스포츠 등...)을 자동적으로 그룹핑 시키는것 google news grouping 이 대표적이다. (컴퓨터보고 스스로 그룹핑해봐' 라고 시킨것) supervised learning 일반적으로 ML에서 주로 사용되는 것이다. ex) Image labeling..