라일락 꽃이 피는 날

인공지능, 머신러닝, 딥러닝 본문

데이터 분석/Python

인공지능, 머신러닝, 딥러닝

eunki 2021. 5. 11. 16:50
728x90

 

인공지능: 사람의 지능을 모방하여, 사람이 하는 것과 같이 복잡한 일을 할 수 있게 기계를 만드는 것

머신러닝: 기본적으로 알고리즘을 이용하여 데이터를 분석 및 학습하며, 학습한 내용을 기반으로 판단이나 예측

딥러닝: 인공신경망에서 발전한 형태의 인공지능, 머신러닝 중 하나의 방법론

 

 

 


머신러닝

데이터(Data)를 기반으로 패턴(Model)을 학습하여 결과를 추론(Prediction)하는 것

 

1. 지도학습 (Supervised Learning)

  1) 회귀 (Regression) - 수치형 (numeric value)  ex) 집값, 가격, 온도 등

  2) 분류 (Classification) - 분류형 (categorical value)  ex) 스팸메일, 종류판별, 암진단 등

 

2. 비지도학습 (Unsupervised Learning)

  1) 군집화 (Clustering) - 그룹핑 (Grouping)  ex) 뉴스 분류, 사용자 관심사 등

  2) 차원 축소 (Dimentionality Reduction)

 

 

 

머신러닝 장점

1. 복잡한 패턴을 인지할 수 있다.

2. 적절한 알고리즘과 다양한 양질의 데이터가 있다면 좋은 성능을 가진다.

3. 도메인 영역에 대한 지식이 상대적으로 부족해도 가능하다.

 

 

 

머신러닝 문제점

1. 데이터의 의존성이 크다 (Garbage in, Garbage out)

2. 과적합의 오류에 빠질 수 있다. (일반화 오류, 데이터 다양성 요구)

3. 풍부한 데이터가 기본적으로 요구된다.

 

 

 


가설함수 (Hypothesis), 손실함수 (Loss Function)

 

 

 

 

제곱 오차 (MSE; Mean Squared Error)

 

손실함수 제곱의 전체 합

 

데이터의 개수가 많아지면 손실이 커지므로 전체 손실의 평균을 구한다.

728x90