>>> X.shape
(392, 8)
>>> y.value_counts() # 데이터 불균형
class
0 262
1 130
Name: count, dtype: int64
SMOTE() 사용, up sampling 기법으로 불균형한 데이터의 균형을 맞춰준다.
# ! pip install imblearn
from imblearn.over_sampling import SMOTE
>>> sm = SMOTE(random_state=5)
>>> X, y = sm.fit_resample(X, y)
>>> X.shape
(524, 8)
>>> y.shape
(524,)
>>> y.value_counts() # 데이터 불균형 문제 해결!
class
0 262
1 262
Name: count, dtype: int64
'인공지능 > 데이터 전처리' 카테고리의 다른 글
[데이터 전처리] Training/Test용 데이터 분리 train_test_split() (0) | 2024.04.12 |
---|---|
[데이터 전처리] 데이터 정규화, 표준화 Feature Scaling, StandardScaler(), MinMaxScaler() (0) | 2024.04.12 |
[데이터 전처리] 레이블 인코딩, 원 핫 인코딩 LabelEncoder(), OneHotEncoder() (0) | 2024.04.12 |
[데이터 전처리] 인공지능 만들기 전 데이터 전처리 (0) | 2024.04.12 |