일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 실습
- Kaggle
- 오라클
- 빅분기
- 데이터 분석
- SQL
- 코딩테스트
- Numpy
- 파이썬
- matplotlib
- level 1
- oracle
- R
- 실기
- seaborn
- python3
- 튜닝
- pandas
- 프로그래머스
- Python
- Oracel
- 빅데이터 분석 기사
- 머신러닝
- level 2
- sklearn
- 카카오
- 알고리즘
- Today
- Total
라일락 꽃이 피는 날
[Pandas] Plot 그래프 본문
Plot 그래프
일반 선 그래프를 나타낸다.
kind 옵션
line | 선 그래프 <기본> |
bar | 바 그래프 |
barh | 수평 바 그래프 |
hist | 히스토그램 |
kde | 커널 밀도 그래프 |
hexbin | 고밀도 산점도 그래프 |
box | 박스 플롯 |
area | 면적 그래프 |
pie | 파이 그래프 |
scatter | 산점도 그래프 |
1. line 그래프
데이터가 연속적인 경우 사용하기 적절하다. ex) 주가 데이터
2. bar/barh 그래프
그룹별로 비교할 때 유용하다.
3. 히스토그램 (hist)
가로축에는 분포, 세로축에는 빈도가 시각화되어 보여진다.
4. 커널 밀도 그래프
히스토그램과 유사하게 밀도를 보여주는 그래프로, 부드러운 라인을 가지고 있다.
5. Hexbin
고밀도 산점도 그래프로, 데이터의 밀도를 추정한다.
x, y 키 값으로 numeric한 값을 넣어 주어야 한다.
6. 박스 플롯(box) ★★★
Median: 중앙값 → 상자 안의 선
3Q (3rd Quartile): 75% 분위의 값 = 3/4값 → 상자 위 테두리
1Q (1st Quartile): 25% 분위의 값 = 1/4값 → 상자 아래 테두리
IQR (Inter Quantile Range) = (3Q - 1Q) × 1.5
박스 플롯 max: 최댓값 = 3Q + IQR → 상자 위의 선
박스 플롯 min: 최솟값 = 1Q – IQR → 상자 아래의 선
outlier: 박스 플롯의 max, min 값을 벗어난 값
7. area plot
line 그래프에서 아래 area를 모두 색칠해 주는 것이 특징이다.
8. pie plot (파이 그래프)
데이터의 점유율을 보여줄 때 유용하다.
9. scatter plot (산점도 그래프) ★
점으로 데이터를 표기해 준다.
x축과 y축을 numeric 한 column으로 지정해주면 그에 맞는 데이터 분포도를 볼 수 있다.
'데이터 분석 > Python' 카테고리의 다른 글
[Numpy] random (0) | 2021.04.27 |
---|---|
[Numpy] reshape (0) | 2021.04.27 |
[Pandas] 원핫인코딩 (One-hot-encoding) (0) | 2021.04.27 |
[Pandas] select_dtypes (0) | 2021.04.27 |
[Pandas] DataFrame의 산술연산 (0) | 2021.04.27 |