IE가 어른이 되기까지

[Python] 판다스 (Pandas) 의 DataFrame 그룹핑하기 본문

DATA SCIENCE/Python

[Python] 판다스 (Pandas) 의 DataFrame 그룹핑하기

기모랑의 초코 2023. 1. 4. 14:28

 

 

 

우리는 Groupby를 통해 데이터를 그룹핑하고

각 그룹에 대해 연산을 수행할 수 있습니다.

 

앞서 배운 연산들을 통해 Groupby라는 함수를

사용해보도록 하겠습니다.

 

 

 

 

DataFrame Groupby

 

import numpy as np
import pandas as pd

grades2_array = np.array([[np.nan,8,9, np.nan],[10,9,np.nan, np.nan],[4, 8, 2, np.nan], [np.nan, 10, 10, np.nan]])
grades2 = pd.DataFrame(grades2_array, columns=["sep", "oct", "nov", "dec"], index=["alice","bob","charles","darwin"])
grades2["hobby"] = ["Biking", "Dancing", "Dancing", "Biking"]
grades2["blood"] = ["A", "B", "AB", "A"]
grades2

 

예시를 위해 'grades2'라는 DataFrame을

만들어보았습니다.

 

Groupby는 수치형 데이터보다는

범주형 데이터로 해주는 것이 좋습니다.

 

 

grouped_grades2 = grades2.groupby("hobby")
grouped_grades2.mean()

'hobby'라는 변수로 DataFrame을

그룹핑해 보았습니다.

 

이를 통해 취미마다 평균을 계산해볼 수 있습니다.

 

 

grouped_grades3 = grades2.groupby("blood")
grouped_grades3.mean()

 

'blood'라는 변수로 DataFrame을 

그룹핑해 보았습니다.

 

이를 통해 혈액형마다 평균을 계산해볼 수 있습니다.

 

 

Comments