본문 바로가기

딥러닝

[KNN] 3. Hyperparameters (하이퍼파라미터) in KNN [KNN] 3. Hyperparameters (하이퍼파라미터) in KNN 이전글보기: 2018/02/07 - [공부/Machine Learning] - [KNN] 2. K-Nearest Neighbor (K 최근접 이웃) Hyperparameter ?하이퍼 파라미터란, 일반적으로 머신러닝에서 어떠한 임의의 모델을 학습시킬때, 사람이 직접 튜닝 (설정) 해주어야하는 변수를 말합니다. Hyperparameters in KNNKNN 모델에서 사람이 직접 설정해주어야 하는 변수는 크게 두가지 입니다.첫째는, 데이터간의 거리를 나타낼 기준 Distance 둘째는, 모델에서 지정할 K의 값 1. Distance (거리)KNN 모델에서 데이터간의 거리는 중요한 지표이자 변수입니다. 왜냐하면, 거리를 어떻게 측정하고.. 더보기
[KNN] 2. K-Nearest Neighbor (K 최근접 이웃) [KNN] 2. K-Nearest Neighbor (K-최근접 이웃 알고리즘)이전글보기: 2018/02/01 - [공부/Machine Learning] - [KNN] 1. Classification (분류) vs Clustering (군집화) KNN 의 정의 KNN 이라 함은, K개의Nearest (가장 가까운)Neighbor (이웃)이라고 정의할 수 있습니다.이것이 어떤 말이냐 하면, 어떠한 임의의 새 데이터 t 가 있을때, 기존의 데이터들 중에서 t까지의 거리가 가장 가까운 k개의 데이터를 순서대로 선택하여, 그 선택받은 데이터들의 라벨에 따라 t의 라벨이 결정될 수 있다는 것입니다. 그림으로 보면 더 이해가 쉽게 됩니다.먼저 위와 같은 데이터들이 검은색과 파란색의 라벨을 가지고 분포한다고 가정합니다.. 더보기
[KNN] 1. Classification (분류) vs Clustering (군집화) [KNN] 1. Classification (분류) vs Clustering (군집화) KNN 에 앞서 이번 시리즈 에서는 KNN 알고리즘에 대해서 설명하려고 합니다. 그런데 KNN 알고리즘을 설명하기 이전에 먼저 알고 가야 할 것이 있는데요, 바로 Classification 과 Clustering 의 차이 입니다. Classification vs Clustering '분류' 와 '군집화' 라는 두 단어는 언뜻 보기에는 같은 말처럼 들리기도 합니다.하지만 머신러닝 알고리즘 내에서 분류와 군집화는 아주 다른 중요한 개념입니다. '분류' 와 '군집화' '분류'란, 소속집단의 정보를 이미 알고 있는 상태에서, 비슷한 집단으로 묶는 방법입니다.다시말해, Label 이 있는 data를 나누는 방법으로, Super.. 더보기