데이터 분석/Python

[Seaborn] 그래프 그리기 1

eunki 2021. 5. 11. 16:17
728x90

seaborn에서 제공하는 샘플 데이터

https://github.com/mwaskom/seaborn-data

 

mwaskom/seaborn-data

Data repository for seaborn examples. Contribute to mwaskom/seaborn-data development by creating an account on GitHub.

github.com

 

titanic = sns.load_dataset('titanic')
tips = sns.load_dataset('tips')
iris = sns.load_dataset('iris')

 

 

 


1. Countplot

countplot은 항목별 개수를 세어준다.

해당 column을 구성하고 있는 value들을 알아서 구분하여 보여준다.

 

 

 

 

가로로 그리기

 

 

 

색상 팔레트 설정

 

 

 

 

2. distplot

matplotlib의 Histogram과 kdeplot을 통합한 그래프

분포와 밀도를 확인할 수 있다.

 

 

 

데이터가 Series인 경우

x = np.random.randn(100)
x = pd.Series(x, name="x variable")

 

 

 

가로로 표현하기

vertical = True 옵션으로 가로로 그릴 수 있다.

 

 

 

컬러 바꾸기

color 옵션에 원하는 컬러를 명시하여 바꿀 수 있다.

 

 

 

rugplot (rug)

데이터 위치를 x축 위에 작은 선분(rug)으로 나타내어 데이터의 위치 및 분포를 보여준다.

 

 

 

kde (kernel density)

histogram보다 부드러운 형태의 분포 곡선을 보여주는 방법이다.

 

 

 

 

3. heatmap

색상으로 표현할 수 있는 다양한 정보를 일정한 이미지 위에 열분포 형태의 비쥬얼한 그래픽으로 출력하는 것이 특징이다.

 

annot=True: 각각의 숫자 표기

 

 

 

pivot table을 활용하여 그리기

 

 

 

correlation(상관관계)를 시각화

corr() 함수는 데이터의 상관관계를 보여준다.

 

 

 

 

 

4. pairplot

그리드(grid) 형태로 각 집합의 조합에 대해 히스토그램과 분포도를 그린다.

이때, 숫자형 column에 대해서만 그려준다.

 

 

 

hue 옵션으로 특성 구분

palette 옵션으로 컬러 팔레트 적용

height 옵션으로 사이즈 적용

 

728x90