Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 잔차분석
- 다중선형회귀분석
- time series
- 결정계수
- Python
- ML
- 비지도학습
- 의사결정나무
- LogisticRegression
- LinearRegression
- deeplearning
- dataframe
- scikitlearn
- 데이터전처리
- 손실함수
- 지도학습
- 로지스틱회귀분석
- OrdinalEncoder
- machinelearning
- DataScience
- 시계열데이터
- 데이터분석
- 분류
- 시계열 데이터
- GridSearchCV
- RegressionTree
- 단순선형회귀분석
- 하이퍼파라미터
- 딥러닝
- 선형회귀분석
Archives
- Today
- Total
IE가 어른이 되기까지
[Python] 판다스 (Pandas) 의 DataFrame 그룹핑하기 본문
우리는 Groupby를 통해 데이터를 그룹핑하고
각 그룹에 대해 연산을 수행할 수 있습니다.
앞서 배운 연산들을 통해 Groupby라는 함수를
사용해보도록 하겠습니다.
DataFrame Groupby
import numpy as np
import pandas as pd
grades2_array = np.array([[np.nan,8,9, np.nan],[10,9,np.nan, np.nan],[4, 8, 2, np.nan], [np.nan, 10, 10, np.nan]])
grades2 = pd.DataFrame(grades2_array, columns=["sep", "oct", "nov", "dec"], index=["alice","bob","charles","darwin"])
grades2["hobby"] = ["Biking", "Dancing", "Dancing", "Biking"]
grades2["blood"] = ["A", "B", "AB", "A"]
grades2
예시를 위해 'grades2'라는 DataFrame을
만들어보았습니다.
Groupby는 수치형 데이터보다는
범주형 데이터로 해주는 것이 좋습니다.
grouped_grades2 = grades2.groupby("hobby")
grouped_grades2.mean()
'hobby'라는 변수로 DataFrame을
그룹핑해 보았습니다.
이를 통해 취미마다 평균을 계산해볼 수 있습니다.
grouped_grades3 = grades2.groupby("blood")
grouped_grades3.mean()
'blood'라는 변수로 DataFrame을
그룹핑해 보았습니다.
이를 통해 혈액형마다 평균을 계산해볼 수 있습니다.
'DATA SCIENCE > Python' 카테고리의 다른 글
[Python] 판다스 (Pandas) 의 DataFrame 결측치 처리하기 (0) | 2023.01.04 |
---|---|
[Python] 판다스 (Pandas) 의 DataFrame 조인 및 연결하기 (0) | 2023.01.04 |
[Python] 판다스 (Pandas) 의 DataFrame 연산하기 (0) | 2023.01.04 |
[Python] 판다스 (Pandas) 의 DataFrame 정렬하기 (0) | 2023.01.04 |
[Python] 판다스 (Pandas) 의 DataFrame 행과 열 다루기 (0) | 2023.01.03 |
Comments