데이터 분석/Python

[Pandas] GroupBy (그룹으로 묶어 보기)

eunki 2021. 4. 26. 19:52
728x90

GroupBy (그룹으로 묶어 보기)

groupby는 데이터를 그룹으로 묶어 분석할 때 활용한다.

소속사별 키의 평균, 그룹별 키의 평균 등 특정 그룹별 통계 및 데이터의 성질을 확인할 때 유용하다.

산술통계는 자동으로 산술통계가 가능한 열만 출력한다.

 

df.groupby('컬럼명')

df.groupby(['컬럼명1', '컬럼명2'])

 

 

 

1. count (개수)

 

 

 

 

2. sum (합계)

 

 

 

 

3. mean (평균)

 

 

 

 

4. aggregate (집계)

 

 

 

 

이외에도 var(분산), std(표준 편차), min(최솟값), max(최댓값) 을 출력할 수 있다.

 

 

 


index를 이용한 GroupBy

index가 있는 경우,  groupby 함수에 level을 사용할 수 있다.

level은 index의 depth를 의미하며 가장 왼쪽에서 0부터 증가한다.

 

df.groupby(level=0)

df.groupby(level=[0, 1])

 

 

 

 

 

728x90