카테고리 없음

Time Series 데이터 처리를 위한 resample 활용

건휘맨 2024. 4. 21. 16:41

1. 컬럼의 데이터 타입을 알아보고 오브젝트 일 경우 데이트 타임으로 변경해준다.

df['Date'].info()

# format=에 해당 컬럼에 날짜가 입력 되어있는 형식을 입력해준다
>>> df['Date'] = pd.to_datetime( df['Date'], format= '%m/%d/%Y %I:%M:%S %p')

 

2. resample 활용

# 각 년도, 월, 분기, 일별로 몇개의 데이터를 가지고 있는지 확인이 가능

# 년도로 리샘플한 후, 각 년도별 몇개의 데이터를 가지고 있는지 확인
>>> df_year = df.resample('YS').size()

# 월별 건수 확인
>>> df_month = df.resample('M').size()

# 분기별 건수 확인 (Quarter)
>>> df_q = df.resample('Q').size()

# 일별 건수 확인
>>> df_day = df.resample('D').size()