[Machine Learning] K- 평균 군집 K-Means Clustering

인공지능/Machine Learning

[Machine Learning] K- 평균 군집 K-Means Clustering

건휘맨 2024. 4. 16. 11:15

Unsupervised Learning 은 y 값이 없고 x 만 필요

kmeans() : 비슷한 특징을 갖는 것들끼리 n개의 그룹을 만들어 분류

from sklearn.cluster import KMeans

# 변수에 저장하여 사용
>>> kmeans = KMeans(n_clusters= 3, random_state=10)
# n_clusters = 그룹의 갯수 지정
# n_clusters 의 default 값은 8

>>> y_pred = kmeans.fit_predict(X) # 학습 x, 바로 예측

# 그룹 1인 그룹 사람들에게 푸시를 보낼 것이다. 이 그룹의 데이터를 가져와라.

>>> df.loc[df['Group'] == 1, ]

WCSS = 적절한 그룹의 개수 기준 확립

>>> wcss = []
>>> for i in range(1,10+1):
        kmeans = KMeans(n_clusters=i, random_state=10)
        kmeans.fit(X)
        wcss.append(kmeans.inertia_)

>>> wcss
[308862.06,
 212889.442455243,
 143391.59236035674,
 104414.67534220166,
 75399.61541401484,
 58348.64136331505,
 51167.19736842105,
 45324.85021951262,
 40811.455768566826,
 37141.48254409704]

Cluster 간의 거리의 합을 나타내는 inertia가 급격히 떨어지는 구간이 생기는데
이 지점의 K 값을 군집의 개수로 사용
inertia_속성으로 확인할 수 있다.

# hyper parameters => 사람이 결정해 줘야하는 파라미터 => 5

>>> kmeans = KMeans(n_clusters=5, random_state=1)

>>> y_pred = kmeans.fit_predict(X)

>>> y_pred
array([3, 1, 3, 1, 3, 1, 3, 1, 3, 1, 3, 1, 3, 1, 3, 1, 3, 1, 3, 1, 3, 1,
       3, 1, 3, 1, 3, 1, 3, 1, 3, 1, 3, 1, 3, 1, 3, 1, 3, 1, 3, 1, 3, 1,
       3, 1, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4,
       4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4,
       4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4,
       4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 2, 0, 2, 4, 2, 0, 2, 0, 2,
       0, 2, 0, 2, 0, 2, 0, 2, 0, 2, 4, 2, 0, 2, 0, 2, 0, 2, 0, 2, 0, 2,
       0, 2, 0, 2, 0, 2, 0, 2, 0, 2, 0, 2, 0, 2, 0, 2, 0, 2, 0, 2, 0, 2,
       0, 2, 0, 2, 0, 2, 0, 2, 0, 2, 0, 2, 0, 2, 0, 2, 0, 2, 0, 2, 0, 2,
       0, 2])

'인공지능 > Machine Learning' 카테고리의 다른 글

[Machine Learning] 계층적 군집화 Hierarchical Clustering (0)	2024.04.16
[Machine Learning] 분류 예측 Decision Tree (0)	2024.04.15
[Machine Learning] 분류 예측 Support Vector Machine (SVM) (0)	2024.04.15
[Machine Learning] 분류 예측 K-NN (0)	2024.04.15
[Machine Learning] 성능 측정 confusion_matrix(), accuracy_score(), classification_report() (1)	2024.04.15

현재글[Machine Learning] K- 평균 군집 K-Means Clustering

코드탐험 신비의 세계

Today :
Yesterday :

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

코드탐험 신비의 세계

[Machine Learning] K- 평균 군집 K-Means Clustering

'인공지능 > Machine Learning' 카테고리의 다른 글

'인공지능/Machine Learning'의 다른글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

2025. 05
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

[Machine Learning] K- 평균 군집 K-Means Clustering

'인공지능 > Machine Learning' 카테고리의 다른 글

'인공지능/Machine Learning'의 다른글

관련글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역