Dummy variable trap 은 없어도 되는 불필요한 컬럼을 없애는 것
# Dummy Variable Trap 을 적용하자.
# 딥러닝에서는 컬럼 하나가 연산에 아주 크게 작용하므로
# 원핫 인코딩한 결과에서 가장 왼쪽의 컬럼은 삭제해도
# 데이터를 표현하는 데는 아무 문제 없다.
# France, Germany, Spain 3개 컬럼으로 원핫 인코딩 되는데
# 1 0 0
# 0 1 0
# 0 0 1
# 맨 왼쪽 France 컬럼을 삭제해도
# 0 0 => France
# 1 0 => Germany
# 0 1 => Spain
>>> pd.DataFrame(X).drop(0, axis=1).values
array([[0.0000000e+00, 0.0000000e+00, 6.1900000e+02, ..., 1.0000000e+00,
1.0000000e+00, 1.0134888e+05],
[0.0000000e+00, 1.0000000e+00, 6.0800000e+02, ..., 0.0000000e+00,
1.0000000e+00, 1.1254258e+05],
[0.0000000e+00, 0.0000000e+00, 5.0200000e+02, ..., 1.0000000e+00,
0.0000000e+00, 1.1393157e+05],
...,
[0.0000000e+00, 0.0000000e+00, 7.0900000e+02, ..., 0.0000000e+00,
1.0000000e+00, 4.2085580e+04],
[1.0000000e+00, 0.0000000e+00, 7.7200000e+02, ..., 1.0000000e+00,
0.0000000e+00, 9.2888520e+04],
[0.0000000e+00, 0.0000000e+00, 7.9200000e+02, ..., 1.0000000e+00,
0.0000000e+00, 3.8190780e+04]])
'인공지능 > Deep Learning' 카테고리의 다른 글
[Deep Learning] DNN TensorFlow Regression 수치 예측 문제 모델링 (0) | 2024.04.17 |
---|---|
[Deep Learning] TensorFlow GridSearch (0) | 2024.04.17 |
[Deep Learning] Optimizer (0) | 2024.04.16 |
[Deep Learning] batch_size, epoch (0) | 2024.04.16 |
[Deep Learning] ANN TensorFlow 분류 문제 모델링 (0) | 2024.04.16 |