인공지능/Deep Learning

[Deep Learning] Dummy variable trap

건휘맨 2024. 4. 16. 17:23

Dummy variable trap 은 없어도 되는 불필요한 컬럼을 없애는 것

# Dummy Variable Trap 을 적용하자.

# 딥러닝에서는 컬럼 하나가 연산에 아주 크게 작용하므로
# 원핫 인코딩한 결과에서 가장 왼쪽의 컬럼은 삭제해도
# 데이터를 표현하는 데는 아무 문제 없다.

# France, Germany, Spain 3개 컬럼으로 원핫 인코딩 되는데
#    1       0       0
#    0       1       0
#    0       0       1

# 맨 왼쪽 France 컬럼을 삭제해도
#  0  0  => France
#  1  0  => Germany
#  0  1  => Spain

>>> pd.DataFrame(X).drop(0, axis=1).values
array([[0.0000000e+00, 0.0000000e+00, 6.1900000e+02, ..., 1.0000000e+00,
        1.0000000e+00, 1.0134888e+05],
       [0.0000000e+00, 1.0000000e+00, 6.0800000e+02, ..., 0.0000000e+00,
        1.0000000e+00, 1.1254258e+05],
       [0.0000000e+00, 0.0000000e+00, 5.0200000e+02, ..., 1.0000000e+00,
        0.0000000e+00, 1.1393157e+05],
       ...,
       [0.0000000e+00, 0.0000000e+00, 7.0900000e+02, ..., 0.0000000e+00,
        1.0000000e+00, 4.2085580e+04],
       [1.0000000e+00, 0.0000000e+00, 7.7200000e+02, ..., 1.0000000e+00,
        0.0000000e+00, 9.2888520e+04],
       [0.0000000e+00, 0.0000000e+00, 7.9200000e+02, ..., 1.0000000e+00,
        0.0000000e+00, 3.8190780e+04]])