일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 알고리즘
- 빅데이터 분석 기사
- level 2
- Numpy
- Python
- python3
- 실기
- 튜닝
- 머신러닝
- level 1
- pandas
- 실습
- R
- SQL
- 데이터 분석
- 카카오
- Kaggle
- seaborn
- 빅분기
- 파이썬
- 오라클
- Oracel
- 코딩테스트
- 프로그래머스
- oracle
- sklearn
- matplotlib
- Today
- Total
목록전체 글 (324)
라일락 꽃이 피는 날
K-최근접 이웃법 (K-Nearest Neighbor) 각 데이터들 간의 거리를 측정하여 가까운 k개의 다른 데이터의 레이블을 참조하여 분류하는 방법 주로 유클리디안 거리 계산법 또는 민코브스키 방법을 사용 모델 기반 알고리즘이 아닌 케이스 기반 알고리즘이므로 입력되는 데이터에 따라 결과와 성능이 크게 다름 k 값이 작을수록 정교한 분류와 예측이 가능하지만 과대적합(overfitting) 문제 발생 k 값이 클수록 정확도나 성능지표가 좋지 않을 수 있고 과소적합(underfitting) 문제 발생 최적의 k는 일반적으로 3~10 범위 내에서 찾는다. [주요 하이퍼파라미터] - n_neighbors : 1에 가까울수록 과대적합, 클수록 과소적합 발생 (default = 5) - metric : 거리 측정 ..
로지스틱 회귀 모델 - 종속 변수가 범주형 자료일 경우 적용하는 회귀 모델 - 원자료를 확률 → 오즈(odds) → 로그(log)로 변환하여 선형 회귀 모델을 적용하고, 다시 지수(exp)로 변환하여 원데이터로 전환한 모델 [주요 하이퍼파라미터] - C : 로그스케일 단위로 최적치 탐색 권고 (default = 1) 작을수록 모델이 단순해지고 커질수록 모델이 복잡해짐 - solver : 데이터 양이 많을 때 풀배치(full-batch)로 할 경우 시간이 오래 걸림 solver='sag' 로 할 경우 평균경사하강법을 적용하여 속도가 빠름 1. 분석 데이터 준비 import warnings warnings.filterwarnings("ignore") 분석 결과 외에 불필요한 내용이 나오지 않도록 하는 옵션 ..
예제 1. 3개의 숫자를 각각 물어보게 하고, 3개의 숫자에 대한 최대 공약수를 출력 accept num1 prompt '첫 번째 숫자를 입력하세요' accept num2 prompt '두 번째 숫자를 입력하세요' accept num3 prompt '세 번째 숫자를 입력하세요' select max(level) from dual where mod(&num1, level) = 0 and mod(&num2, level) = 0 and mod(&num3, level) = 0 connect by level

1. 구구단 1단 ~ 9단 출력 with num_table1 as ( select level as num1 from dual connect by level
하나의 SQL 에서 비슷한 select 문장이 반복되어서 나타나는 경우, with 절로 작성하면 성능을 개선할 수 있다. 단, 여러 개의 with 절을 동시에 여러 사람이 한꺼번에 수행하면 다 같이 느려진다. 예제 1. 1부터 10까지의 숫자 중에 짝수만 출력 with table_10 as ( select level as num from dual connect by level
예제 1. 사원 테이블의 월급이 0~9000 사이의 데이터만 입력 또는 수정되게끔 check 제약 걸기 alter table emp add constraint emp_sal_ck check(sal between 0 and 9000); 예제 2. email 에 체크 제약을 거는데, 이메일에 @ 와 . 이 없으면 에러가 나게끔 제약 걸기 alter table emp add constraint emp_email_ck check(email like '%@%.%'); alter table emp add constraint emp_email_ck check(email like '%@%' and email like '%.%'); 예제 3. 통신사 컬럼에 제약을 거는데 데이터가 sk, lg, kt 만 입력 또는 수정되..
제약 (constraint) 데이터의 품질을 높이기 위해서 사용하는 데이터 베이스 오브젝트 제약의 종류 1. primary key 제약 : 해당 테이블을 대표하는 컬럼에 거는 제약 이 제약이 걸리면 해당 컬럼에는 중복된 데이터와 null 값을 입력할 수 없다. 2. unique 제약 : 중복된 데이터를 입력하지 못하게 하는 제약 3. not null 제약 : null 값을 입력하지 못하게 하는 제약 4. check 제약 : 사용자가 허락한 데이터만 입력하게끔 하는 제약 5. foreign key 제약 : 자식 테이블에 거는 제약 (부모 테이블에게 의존할 자식 테이블) [테이블에 제약 걸기] 1. 테이블을 생성할 때 제약을 거는 방법 1-1. column level (컬럼 레벨) -- primary key..
1. 테이블 생성 drop table insurance; create table insurance ( age number(3), sex varchar2(10), bmi number(10,2), children number(2), smoker varchar2(10), region varchar2(20), expenses number(10,2) ); -- 1338 select count(*) from insurance; id 컬럼에 번호를 순서대로 1번부터 부여 create table insurance2 as select rownum as id, i.* from insurance i; drop table insurance; rename insurance2 to insurance; 2. 훈련 데이터와 테스트 ..