Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 데이터 분석
- SQL
- matplotlib
- level 2
- 코딩테스트
- 머신러닝
- 카카오
- Python
- 실기
- python3
- 튜닝
- Kaggle
- 실습
- Numpy
- 파이썬
- level 1
- Oracel
- 프로그래머스
- R
- pandas
- seaborn
- 오라클
- 빅분기
- 알고리즘
- oracle
- sklearn
- 빅데이터 분석 기사
Archives
- Today
- Total
라일락 꽃이 피는 날
[Pandas] GroupBy (그룹으로 묶어 보기) 본문
728x90
GroupBy (그룹으로 묶어 보기)
groupby는 데이터를 그룹으로 묶어 분석할 때 활용한다.
소속사별 키의 평균, 그룹별 키의 평균 등 특정 그룹별 통계 및 데이터의 성질을 확인할 때 유용하다.
산술통계는 자동으로 산술통계가 가능한 열만 출력한다.
df.groupby('컬럼명')
df.groupby(['컬럼명1', '컬럼명2'])
1. count (개수)
2. sum (합계)
3. mean (평균)
4. aggregate (집계)
이외에도 var(분산), std(표준 편차), min(최솟값), max(최댓값) 을 출력할 수 있다.
index를 이용한 GroupBy
index가 있는 경우, groupby 함수에 level을 사용할 수 있다.
level은 index의 depth를 의미하며 가장 왼쪽에서 0부터 증가한다.
df.groupby(level=0)
df.groupby(level=[0, 1])
728x90
'데이터 분석 > Python' 카테고리의 다른 글
[Pandas] 결측값, 중복값 처리 (0) | 2021.04.26 |
---|---|
[Pandas] Multi-Index (복합 인덱스) (0) | 2021.04.26 |
[Pandas] 피벗 테이블 (pivot_table) (0) | 2021.04.26 |
[Pandas] 통계 값 다루기 (0) | 2021.04.26 |
[Pandas] row, column 추가/제거 (0) | 2021.04.26 |