'데이터 분석/Python' 카테고리의 글 목록 (5 Page)

Notice

Recent Posts

Recent Comments

Link

« 2025/09 »
일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

Tags more

Archives

Today

Total

관리 메뉴

목록데이터 분석/Python (72)

라일락 꽃이 피는 날

[Sklearn] 분류 (classification)

1. Logistic Regression 로지스틱 회귀는 독립 변수의 선형 결합을 이용하여 사건의 발생 가능성을 예측하는데 사용되는 통계 기법이다. 서포트 벡터 머신(SVM)과 같은 알고리즘은 이진 분류만 가능하다. (2개의 클래스 판별만 가능) 3개 이상의 클래스에 대한 판별을 진행하는 경우, 다음과 같은 전략으로 판별한다. ① one-vs-rest(OvR) K개의 클래스가 존재할 때 1개의 클래스를 제외한 다른 클래스를 K개 만들어, 각각의 이진 분류에 대한 확률을 구하고 총합을 통해 최종 클래스를 판별한다. ② one-vs-one(OvO) 4개의 계절을 구분하는 클래스가 존재한다고 가정했을 때, 0vs1, 0vs2, 0vs3, ... , 2vs3 까지 NX(N-1)/2개의 분류기를 만들어 가장 많이..

데이터 분석/Python 2021. 5. 13. 19:51

[Sklearn] 데이터 셋 (dataset)

데이터 셋 (dataset) DESCR: dataset 정보 data: feature data feature_names: feature data의 컬럼 이름 target: label data (수치형) target_names: label의 이름 (문자형) from sklearn.datasets import load_iris iris = load_iris() data = iris['data'] feature_names = iris['feature_names'] target = iris['target'] 데이터프레임 생성 df_iris = pd.DataFrame(data, columns=feature_names) df_iris['target'] = target train / validation 세트 나누기 ..

데이터 분석/Python 2021. 5. 13. 19:22

[Sklearn] 전처리 (pre-processing)

전처리 (pre-processing) 데이터를 분석에 적합하게 가공/변형/처리/클리닝 train / validation 세트 나누기 feature와 label을 정의한 후, 적절한 비율로 train / validation set을 나눈다. feature = ['Pclass', 'Sex', 'Age', 'Fare'] label = ['Survived'] test_size: validation set에 할당할 비율 (20% → 0.2) shuffle: 셔플 옵션 (기본:True) random_state: 랜덤 시드값 from sklearn.model_selection import train_test_split x_train, x_valid, y_train, y_valid = train_test_split(t..

데이터 분석/Python 2021. 5. 11. 17:01

[Sklearn] Training Set, Test Set

scikit-learn https://scikit-learn.org/stable/ scikit-learn: machine learning in Python — scikit-learn 0.24.2 documentation Model selection Comparing, validating and choosing parameters and models. Applications: Improved accuracy via parameter tuning Algorithms: grid search, cross validation, metrics, and more... scikit-learn.org from sklearn.linear_model import LinearRegression 모델 선언: model = Li..

데이터 분석/Python 2021. 5. 11. 17:00

인공지능, 머신러닝, 딥러닝

인공지능: 사람의 지능을 모방하여, 사람이 하는 것과 같이 복잡한 일을 할 수 있게 기계를 만드는 것 머신러닝: 기본적으로 알고리즘을 이용하여 데이터를 분석 및 학습하며, 학습한 내용을 기반으로 판단이나 예측 딥러닝: 인공신경망에서 발전한 형태의 인공지능, 머신러닝 중 하나의 방법론 머신러닝 데이터(Data)를 기반으로 패턴(Model)을 학습하여 결과를 추론(Prediction)하는 것 1. 지도학습 (Supervised Learning) 1) 회귀 (Regression) - 수치형 (numeric value) ex) 집값, 가격, 온도 등 2) 분류 (Classification) - 분류형 (categorical value) ex) 스팸메일, 종류판별, 암진단 등 2. 비지도학습 (Unsupervis..

데이터 분석/Python 2021. 5. 11. 16:50

[Seaborn] 그래프 그리기 2

5. violinplot 바이올린처럼 생겨서 violinplot이다. column에 대한 데이터의 비교 분포도를 확인할 수 있다. 곡선 진 부분(뚱뚱한 부분)은 데이터의 분포를 나타내고, 양쪽 끝 뾰족한 부분은 데이터의 최솟값과 최댓값을 나타낸다. 비교 분포 확인 x, y축을 지정해줌으로썬 바이올린을 분할하여 비교 분포를 볼 수 있다. 가로로 뉘인 violinplot hue 옵션으로 분포 비교 단일 column에 대한 바이올린 모양의 비교를 할 수 있다. split 옵션으로 바이올린을 합쳐서 볼 수 있다. 6. lmplot lmplot은 column 간의 선형관계를 확인하기에 용이한 차트다. 또한, outlier도 같이 짐작해 볼 수 있다. hue 옵션으로 다중 선형관계 그리기 col 옵션을 추가하여 그..

데이터 분석/Python 2021. 5. 11. 16:34

[Seaborn] 그래프 그리기 1

seaborn에서 제공하는 샘플 데이터 https://github.com/mwaskom/seaborn-data mwaskom/seaborn-data Data repository for seaborn examples. Contribute to mwaskom/seaborn-data development by creating an account on GitHub. github.com titanic = sns.load_dataset('titanic') tips = sns.load_dataset('tips') iris = sns.load_dataset('iris') 1. Countplot countplot은 항목별 개수를 세어준다. 해당 column을 구성하고 있는 value들을 알아서 구분하여 보여준다. 가로로..

데이터 분석/Python 2021. 5. 11. 16:17

[Seaborn] matplotlib 그래프를 seaborn으로 그리기

seaborn matplotlib을 기반으로 다양한 색상과 차트를 지원하는 라이브러리 컬러 팔레트를 이용한 아름다운 디자인과 쉬운 사용성 보유 seaborn에서만 제공되는 통계 기능 기반의 plot pandas, matplotlib와 호환 가능 https://seaborn.pydata.org/ seaborn: statistical data visualization — seaborn 0.11.1 documentation Seaborn is a Python data visualization library based on matplotlib. It provides a high-level interface for drawing attractive and informative statistical graphics..

데이터 분석/Python 2021. 5. 11. 15:58

이전 Prev 1 2 3 4 5 6 7 8 9 Next 다음

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

라일락 꽃이 피는 날

목록데이터 분석/Python (72)

라일락 꽃이 피는 날

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역