일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
- Numpy
- 카카오
- Kaggle
- Python
- pandas
- python3
- sklearn
- 실습
- SQL
- level 2
- 데이터 분석
- 빅분기
- seaborn
- 코딩테스트
- 프로그래머스
- 튜닝
- 오라클
- 실기
- Oracel
- R
- 빅데이터 분석 기사
- 파이썬
- 알고리즘
- 머신러닝
- oracle
- level 1
- matplotlib
- Today
- Total
목록Python (164)
라일락 꽃이 피는 날
1. 컬럼 선택 (Column Selection) ① 하나의 컬럼 선택 : df['컬럼명'] ② 복수의 컬럼 선택 : df[['컬럼명1', '컬럼명2', '컬럼명3']] 2. 범위 선택 (Range Selection) ① index에 대한 범위 선택 ② loc ★★★ (~이상 ~이하) ③ iloc (position으로 색인) (~이상 ~미만) 3. 조건을 활용한 색인 (Boolean Indexing) Numpy의 Boolean 인덱싱과 같은 원리 4. isin을 활용한 색인 내가 조건을 걸고자 하는 값이 내가 정의한 list에 있을 때만 색인하려는 경우에 사용
1. 오름차순 index 정렬 2. 내림차순 index 정렬 3. column별 오름차순 정렬 4. column별 내림차순 정렬 5. column별 오름차순 복수정렬 6. column별 내림차순 복수정렬
1. 기본 정보 알아보기 index(행) 출력 df.index column(열) 출력 df.columns column(열) 순서 재배치 df = df[['그룹', '이름', '성별', '소속사', '키', '생년월일', '브랜드평판지수', '혈액형']] df.columns column(열) 이름 재정의 new_col = ['name', '그룹', '소속사', '성별', '생년월일', '키', '혈액형', '브랜드평판지수'] df.columns = new_col df.columns df = df.rename(columns={'이름':'name'}) df.columns shape(형태) 출력 df.shape 컬럼들의 dtypes(데이터타입) 출력 df.dtypes 기본 정보(info) 출력 기본적인 row(..
CSV 파일 Comma Separated Value의 약어로써, 쉼표로 구분된 파일 엑셀을 로딩할 수도 있지만, 쉼표로 구분된 파일이 훨씬 가볍다. 공공데이터 포털에서도 CSV 포맷의 파일을 제공한다. 1. 로컬에서 파일 읽어오기 from google.colab import files myfile = files.upload() import pandas as pd import io pd.read_csv(io.BytesIO(myfile['파일명'])) # csv 파일 읽기 pd.read_excel(io.BytesIO(myfile['파일명'])) # excel 파일 읽기 2. 구글 드라이브에 있는 샘플 파일 읽어오기 from google.colab import drive drive.mount('/content..
Pandas : 데이터 분석을 위한 패키지 import pandas as pd 1. Series 1차원으로 이루어진 데이터 배열, 1개의 column s1 = pd.Series([1, 2, 3]) s1 s2 = pd.Series(['a', 'b', 'c']) s2 s3 = pd.Series(np.arange(200)) s3 s4 = pd.Series([1, 2, 3], [100, 200, 300]) s4 2. DataFrame 2차원으로 이루어진 데이터 배열 list로 DataFrame 만들기 제목컬럼 만들기 (columns) dict로 DataFrame 만들기 index를 특정 column으로 지정하기 하나의 column 조회 column 타입 = Series
1. 산술 연산자 + 두 값을 더한 결과를 반환 - 두 값을 뺀 결과를 반환 * 두 값을 곱한 결과를 반환 / 두 값을 나눈 결과를 반환 (실수 값) // 두 값을 나눈 결과의 몫 반환 (정수 값) % 두 값을 나눈 결과의 나머지 반환 ** 거듭 제곱의 결과를 반환 print(3 + 2) # 5 print(3 - 2) # 1 print(3 * 2) # 6 print(3 / 2) # 1.5 print(3 // 2) # 1 print(3 % 2) # 1 print(3 ** 2) # 9 2. 비교 연산자 == 두 값이 동일하면 True, 동일하지 않으면 False != 두 값이 동일하지 않으면 True, 동일하면 False > 왼쪽의 값이 크면 True, 그렇지 않으면 False = 왼쪽의 값이 크거나 같으면..
사용자 입력 값 받기 input() input('값 입력: ') 사용자 입력 값을 변수에 저장하기 userin = input('값 입력: ') 이때, 입력 값은 항상 문자열로만 자료를 입력받는다. a = input('값을 입력 하시오 : ') print('사용자가 {}을 입력 하였습니다.'.format(a)) print('사용자 입력 자료형 : {}'.format(type(a))) 값을 입력 하시오 : 1 사용자가 1을 입력 하였습니다. 사용자 입력 자료형 : 자료형 변환을 통해 다른 자료형으로 입력받을 수 있다. b = int(input('정수 값을 입력 하시오 : ')) print('사용자가 {}을 입력 하였습니다.'.format(b)) print('사용자 입력 자료형 : {}'.format(type..
자료형 종류 1. int (정수) : 0, 음수, 양수 값을 포함하는 숫자 값 2. float (실수) : 소수점을 사용하는 숫자 값 3. str (문자열) : 따옴표로 묶여 있는 값 4. bool (부울형) : True, False만을 가지는 값 5. list (리스트) : 정수, 실수 및 문자열 등 자료들의 순서가 있는 집합 [ ] 6. tuple (튜플) : 정수, 실수 및 문자열 등 자료들의 순서가 있는 읽기 전용 집합 ( ) 7. set (셋) : 정수, 실수 및 문자열 등 자료들의 순서가 없고 중복이 불가능한 집합 { } 8. dict (사전) : 정수, 실수 및 문자열 등 자료들의 키(key)와 값(value)이 쌍으로 존재하는 집합 { } 자료형 확인 type(변수명) a = 10 b = ..