Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
Tags
- 빅데이터 분석 기사
- python3
- 프로그래머스
- Oracel
- level 2
- Numpy
- Kaggle
- seaborn
- R
- 데이터 분석
- 빅분기
- 카카오
- 알고리즘
- pandas
- 실습
- level 1
- 튜닝
- matplotlib
- 실기
- oracle
- sklearn
- 머신러닝
- 파이썬
- 코딩테스트
- SQL
- 오라클
- Python
Archives
- Today
- Total
라일락 꽃이 피는 날
[Pandas] 기본 정보, 통계 정보 본문
728x90
1. 기본 정보 알아보기
index(행) 출력
df.index
column(열) 출력
df.columns
column(열) 순서 재배치
df = df[['그룹', '이름', '성별', '소속사', '키', '생년월일', '브랜드평판지수', '혈액형']]
df.columns
column(열) 이름 재정의
new_col = ['name', '그룹', '소속사', '성별', '생년월일', '키', '혈액형', '브랜드평판지수']
df.columns = new_col
df.columns
df = df.rename(columns={'이름':'name'})
df.columns
shape(형태) 출력
df.shape
컬럼들의 dtypes(데이터타입) 출력
df.dtypes
기본 정보(info) 출력
기본적인 row(행)의 정보와 데이터 타입을 알려준다.
주로 빠진 값(null)과 데이터 타입을 볼 때 활용한다.
df.info()
column(열)의 고유값
df['혈액형'].unique()
column(열)에 각각의 value가 몇개 있는지 확인
df['혈액형'].value_counts()
2. 통계 정보 알아보기
통계 정보(describe) 출력
데이터의 개수, 평균, 표준편차, 최솟값, 최댓값 등을 알려준다.
수치 데이터로 이루어진 컬럼만 출력된다.
df.describe()
3. 상위/하위 정보 보기
head(): 상위 5개 row 출력
tail(): 하위 5개 row 출력
df.head()
df.tail()
df.head(3)
df.tail(2)
랜덤으로 row 출력
df.sample(3)
728x90
'데이터 분석 > Python' 카테고리의 다른 글
[Pandas] indexing (색인) (0) | 2021.04.26 |
---|---|
[Pandas] 정렬 (0) | 2021.04.26 |
[Pandas] 파일 읽어오기 (0) | 2021.04.26 |
[Pandas] Series, DataFrame (0) | 2021.04.26 |
[Numpy] matrix (행렬) (0) | 2021.04.23 |