[Seaborn] 그래프 그리기 1
seaborn에서 제공하는 샘플 데이터
https://github.com/mwaskom/seaborn-data
mwaskom/seaborn-data
Data repository for seaborn examples. Contribute to mwaskom/seaborn-data development by creating an account on GitHub.
github.com
titanic = sns.load_dataset('titanic')
tips = sns.load_dataset('tips')
iris = sns.load_dataset('iris')
1. Countplot
countplot은 항목별 개수를 세어준다.
해당 column을 구성하고 있는 value들을 알아서 구분하여 보여준다.
가로로 그리기
색상 팔레트 설정
2. distplot
matplotlib의 Histogram과 kdeplot을 통합한 그래프
분포와 밀도를 확인할 수 있다.
데이터가 Series인 경우
x = np.random.randn(100)
x = pd.Series(x, name="x variable")
가로로 표현하기
vertical = True 옵션으로 가로로 그릴 수 있다.
컬러 바꾸기
color 옵션에 원하는 컬러를 명시하여 바꿀 수 있다.
rugplot (rug)
데이터 위치를 x축 위에 작은 선분(rug)으로 나타내어 데이터의 위치 및 분포를 보여준다.
kde (kernel density)
histogram보다 부드러운 형태의 분포 곡선을 보여주는 방법이다.
3. heatmap
색상으로 표현할 수 있는 다양한 정보를 일정한 이미지 위에 열분포 형태의 비쥬얼한 그래픽으로 출력하는 것이 특징이다.
annot=True: 각각의 숫자 표기
pivot table을 활용하여 그리기
correlation(상관관계)를 시각화
corr() 함수는 데이터의 상관관계를 보여준다.
4. pairplot
그리드(grid) 형태로 각 집합의 조합에 대해 히스토그램과 분포도를 그린다.
이때, 숫자형 column에 대해서만 그려준다.
hue 옵션으로 특성 구분
palette 옵션으로 컬러 팔레트 적용
height 옵션으로 사이즈 적용