[Python] 판다스 (Pandas) 의 DataFrame 그룹핑하기

Notice

Recent Posts

Recent Comments

Link

« 2025/07 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

IE가 어른이 되기까지

[Python] 판다스 (Pandas) 의 DataFrame 그룹핑하기 본문

DATA SCIENCE/Python

[Python] 판다스 (Pandas) 의 DataFrame 그룹핑하기

기모랑의 초코 2023. 1. 4. 14:28

우리는 Groupby를 통해 데이터를 그룹핑하고

각 그룹에 대해 연산을 수행할 수 있습니다.

앞서 배운 연산들을 통해 Groupby라는 함수를

사용해보도록 하겠습니다.

DataFrame Groupby

import numpy as np
import pandas as pd

grades2_array = np.array([[np.nan,8,9, np.nan],[10,9,np.nan, np.nan],[4, 8, 2, np.nan], [np.nan, 10, 10, np.nan]])
grades2 = pd.DataFrame(grades2_array, columns=["sep", "oct", "nov", "dec"], index=["alice","bob","charles","darwin"])
grades2["hobby"] = ["Biking", "Dancing", "Dancing", "Biking"]
grades2["blood"] = ["A", "B", "AB", "A"]
grades2

예시를 위해 'grades2'라는 DataFrame을

만들어보았습니다.

Groupby는 수치형 데이터보다는

범주형 데이터로 해주는 것이 좋습니다.

grouped_grades2 = grades2.groupby("hobby")
grouped_grades2.mean()

'hobby'라는 변수로 DataFrame을

그룹핑해 보았습니다.

이를 통해 취미마다 평균을 계산해볼 수 있습니다.

grouped_grades3 = grades2.groupby("blood")
grouped_grades3.mean()

'blood'라는 변수로 DataFrame을

그룹핑해 보았습니다.

이를 통해 혈액형마다 평균을 계산해볼 수 있습니다.

저작자표시 (새창열림)

'DATA SCIENCE > Python' 카테고리의 다른 글

[Python] 판다스 (Pandas) 의 DataFrame 결측치 처리하기 (0)	2023.01.04
[Python] 판다스 (Pandas) 의 DataFrame 조인 및 연결하기 (0)	2023.01.04
[Python] 판다스 (Pandas) 의 DataFrame 연산하기 (0)	2023.01.04
[Python] 판다스 (Pandas) 의 DataFrame 정렬하기 (0)	2023.01.04
[Python] 판다스 (Pandas) 의 DataFrame 행과 열 다루기 (0)	2023.01.03

'DATA SCIENCE/Python' Related Articles

Comments

IE가 어른이 되기까지

[Python] 판다스 (Pandas) 의 DataFrame 그룹핑하기 본문

[Python] 판다스 (Pandas) 의 DataFrame 그룹핑하기

'DATA SCIENCE > Python' 카테고리의 다른 글

티스토리툴바