라일락 꽃이 피는 날

[Pandas] Plot 그래프 본문

데이터 분석/Python

[Pandas] Plot 그래프

eunki 2021. 4. 27. 20:10
728x90

Plot 그래프

일반 선 그래프를 나타낸다.

 

 

 

 

kind 옵션

 

line 선 그래프 <기본>
bar 바 그래프
barh 수평 바 그래프
hist 히스토그램
kde 커널 밀도 그래프
hexbin 고밀도 산점도 그래프
box 박스 플롯
area 면적 그래프
pie 파이 그래프
scatter 산점도 그래프

 

 

 

1. line 그래프

데이터가 연속적인 경우 사용하기 적절하다. ex) 주가 데이터

 

 

 

 

 

 

2. bar/barh 그래프

그룹별로 비교할 때 유용하다.

 

 

 

 

 

 

3. 히스토그램 (hist)

가로축에는 분포, 세로축에는 빈도가 시각화되어 보여진다.

 

 

 

 

4. 커널 밀도 그래프

히스토그램과 유사하게 밀도를 보여주는 그래프로, 부드러운 라인을 가지고 있다.

 

 

 

 

5. Hexbin

고밀도 산점도 그래프로, 데이터의 밀도를 추정한다.

x, y 키 값으로 numeric한 값을 넣어 주어야 한다.

 

 

 

 

6. 박스 플롯(box) ★★★

 

Median: 중앙값 → 상자 안의 선

3Q (3rd Quartile): 75% 분위의 값 = 3/4값 → 상자 위 테두리

1Q (1st Quartile): 25% 분위의 값 = 1/4값 → 상자 아래 테두리

IQR (Inter Quantile Range) = (3Q - 1Q) × 1.5

박스 플롯 max: 최댓값 = 3Q + IQR → 상자 위의 선

박스 플롯 min: 최솟값 = 1Q – IQR → 상자 아래의 선

outlier: 박스 플롯의 max, min 값을 벗어난 값

 

 

 

 

 

7. area plot

line 그래프에서 아래 area를 모두 색칠해 주는 것이 특징이다.

 

 

 

 

8. pie plot (파이 그래프)

데이터의 점유율을 보여줄 때 유용하다.

 

 

 

 

9. scatter plot (산점도 그래프) ★

점으로 데이터를 표기해 준다.

x축과 y축을 numeric 한 column으로 지정해주면 그에 맞는 데이터 분포도를 볼 수 있다.

 

728x90

'데이터 분석 > Python' 카테고리의 다른 글

[Numpy] random  (0) 2021.04.27
[Numpy] reshape  (0) 2021.04.27
[Pandas] 원핫인코딩 (One-hot-encoding)  (0) 2021.04.27
[Pandas] select_dtypes  (0) 2021.04.27
[Pandas] DataFrame의 산술연산  (0) 2021.04.27