[Python] Pandas DataFrame 정렬 sort_values(), sort_index() sort_values() : 데이터프레임의 값을 기준으로 행을 정렬 주어진 열의 값을 기준으로 데이터를 정렬하며, 기본적으로 오름차순(ascending)으로 정렬 내림차순으로 정렬하려면 ascending=False 옵션 사용 sort_index() : 데이터프레임의 인덱스를 기준으로 행을 정렬 기본적으로 인덱스를 오름차순으로 정렬 ascending=False 옵션을 사용하여 내림차순으로 정렬 가능 Python/Pandas 2024.04.11
[Python] Pandas DataFrame 합치기 pd.concat(), pd.merge() pd.concat(): pd.concat() 함수는 여러 개의 DataFrame을 이어붙이는 역할 pd.merge(): pd.merge() 함수는 두 개의 DataFrame을 병합하는 역할 공통 열이나 인덱스를 기준으로 두 DataFrame을 병합 Python/Pandas 2024.04.08
[Python] Pandas DataFrame 데이터 확인하기 head(), tail(), shape, describe(), info() head(): 기본적으로 처음 5개의 행을 반환, 파라미터를 전달하여 원하는 개수의 행을 얻을 수 있다. tail(): 기본적으로 마지막 5개의 행을 반환, 파라미터를 전달하여 원하는 개수의 행을 얻을 수 있다. shape: 데이터프레임의 행과 열의 개수를 튜플 형태로 반환 describe(): 평균, 표준편차, 최소값, 최대값, 중간값 및 사분위수 info(): 각 열에 대한 정보를 요약하여 제공 열의 데이터 유형, 누락된 값의 개수, 메모리 사용량 등 Python/Pandas 2024.04.08
[Python] Pandas DataFrame 중복 데이터 그룹 groupby() 카테고리컬 데이터 ( Categorical Data ) : 중복이 발생하는 데이터 카테고리컬 데이터의 경우 데이터 분석시 데이터별로 묶어서 데이터를 분석할 수 있다 groupby() 함수는 DataFrame을 특정 열의 값에 따라 그룹으로 묶어주는 역할을 한다. 그룹화된 데이터를 다양한 집계 함수를 사용하여 요약할 수 있다. 카테고리 없음 2024.04.08
[Python] Pandas DataFrame 유일한 값 찾기 unique(), nunique() unique() : 유일한 값들이 어떠한 값이 있는지 알려준다. nunique() : 유일한 값들의 총 갯수 Python/Pandas 2024.04.08
[Python] Pandas DataFrame 인덱스 변경, 초기화 set_index(), reset_index() df.set_index('컬럼') : 기존에 있는 컬럼의 값을 인덱스로 만든다. df.reset_index() : 인덱스를 원래대로 초기화 시킨다. Python/Pandas 2024.04.08
[Python] Pandas DataFrame NaN 처리 isna(), notna(), dropna(), fillna(), ffill(), bfill() isna() , notna() isna() 메서드는 각 요소가 NaN인지 여부를 확인하고, notna() 메서드는 NaN이 아닌 요소를 확인 Nan 을 처리하는 방법 1. 삭제하는 방법 2. 특정 값으로 채우는 방법 3. 비어있는 데이터를 채우되 위 행, 아래 행의 데이터로 채우거나 왼쪽 열, 오른쪽 열의 데이터로 채우는 방법 Python/Pandas 2024.04.05
[Python] Pandas csv 파일 불러오기 pd.read_csv() pd.read_csv('csv파일명') : csv파일 불러오기 ../ => 상위 파일 위와 같이 Unnamed : 0 이 출력 됐을 때 index_col= 0 로 해당 컬럼 " Unnamed : 0 " 을 인덱스로 지정 Unnamed : 0 이 인덱스로 지정된 모습 Python/Pandas 2024.04.05
[Python] Pandas DataFrame 가져오기 loc[], iloc[] 데이터 프레임에서 원하는 데이터를 엑세스하는 방법은 3가지이다 1. 컬럼의 데이터를 가져오는 방법 : 변수명 바로 오른쪽에 대괄호 사용 import pandas as pd items2 = [{'bikes': 20, 'pants': 30, 'watches': 35}, {'watches': 10, 'glasses': 50, 'bikes': 15, 'pants':5}] df = pd.DataFrame(data = items2, index= ['store 1', 'store 2']) >>> df['bikes'] store 1 20 store 2 15 Name: bikes, dtype: int64 >>> df['watches'] store 1 35 store 2 10 Name: watches, dtype: int.. Python/Pandas 2024.04.05
[Python] Pandas Series 데이터 확인 index, values, shape, ndim, size, dtype index: Series의 인덱스를 확인 values: Series의 데이터 값을 확인 shape: Series의 차원을 튜플 형태로 확인 ndim: Series의 차원 수를 확인 size: Series의 요소 수를 확인 dtype: Series의 데이터 타입을 확인 import pandas as pd # 예제 Series 생성 index = ['eggs', 'apples', 'milk', 'bread'] data = [30, 6, 'Yes', 'No'] groceries = pd.Series(data=data, index=index) # index 확인 print("Index:", groceries.index) # values 확인 print("Values:", groceries.values) # sh.. Python/Pandas 2024.04.05