Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- pandas
- 머신러닝
- oracle
- 오라클
- 파이썬
- 코딩테스트
- 알고리즘
- R
- matplotlib
- 튜닝
- 빅데이터 분석 기사
- Numpy
- 카카오
- Kaggle
- level 2
- SQL
- Python
- 데이터 분석
- Oracel
- 실습
- 빅분기
- 프로그래머스
- level 1
- sklearn
- 실기
- python3
- seaborn
Archives
- Today
- Total
라일락 꽃이 피는 날
형태소 분석기 본문
728x90
형태소 분석기
- 꼬꼬마 http://kkma.snu.ac.kr/documents/
- 한나눔 http://semanticweb.kaist.ac.kr/hannanum/index.html
- 트위터 https://github.com/twitter/twitter-korean-text
!pip install konlpy
from konlpy.tag import Hannanum
from konlpy.tag import Twitter
from konlpy.tag import Kkma
hannanum=Hannanum()
twitter=Twitter()
kkma = Kkma()
꼬꼬마 형태소 분석기
- 문장을 형태소 단위로 분리하고 품사를 태깅한다.
- 품사태그는 일반명사(NNG), 고유명사(NNP), 동사(VV), 형용사(VA) 등이 있다.
- 형태소 리스트 확인: http://kkma.snu.ac.kr/documents/index.jsp?doc=postag
print(kkma.sentences('아버지가 방에 들어가셨다. 아버지 가방에 들어가셨다. 아버지가 방 안에 있는 가방에 들어가셨다.'))
# ['아버지가 방에 들어가셨다.', '아버지 가방에 들어가셨다.', '아버지가 방 안에 있는 가방에 들어가셨다.']
kkma.pos('아버지가 방에 들어가셨다.')
# [('아버지', 'NNG'), ('가', 'JKS'), ('방', 'NNG'), ('에', 'JKM'), ('들어가', 'VV'), ('시', 'EPH'), ('었', 'EPT'), ('다', 'EFN'), ('.', 'SF')]
kkma.pos('아버지 가방에 들어가셨다.')
# [('아버지', 'NNG'), ('가방', 'NNG'), ('에', 'JKM'), ('들어가', 'VV'), ('시', 'EPH'), ('었', 'EPT'), ('다', 'EFN'), ('.', 'SF')]
kkma.pos('아버지가 방 안에 있는 가방에 들어가셨다.')
# [('아버지', 'NNG'), ('가', 'JKS'), ('방', 'NNG'), ('안', 'NNG'), ('에', 'JKM'), ('있', 'VV'), ('는', 'ETD'), ('가방', 'NNG'), ('에', 'JKM'), ('들어가', 'VV'), ('시', 'EPH'), ('었', 'EPT'), ('다', 'EFN'), ('.', 'SF')]
한나눔 형태소 분석기
hannanum.pos('아버지가 방에 들어가셨다.')
# [('아버지', 'N'), ('가', 'J'), ('방', 'N'), ('에', 'J'), ('들', 'P'), ('어', 'E'), ('가', 'P'), ('셨다', 'E'), ('.', 'S')]
hannanum.pos('아버지 가방에 들어가셨다.')
# [('아버지', 'N'), ('가방', 'N'), ('에', 'J'), ('들', 'P'), ('어', 'E'), ('가', 'P'), ('셨다', 'E'), ('.', 'S')]
hannanum.pos('아버지가 방 안에 있는 가방에 들어가셨다.')
# [('아버지', 'N'), ('가', 'J'), ('방', 'N'), ('안', 'N'), ('에', 'J'), ('있', 'P'), ('는', 'E'), ('가방', 'N'), ('에', 'J'), ('들', 'P'), ('어', 'E'), ('가', 'P'), ('셨다', 'E'), ('.', 'S')]
트위터 형태소 분석기
twitter.pos('아버지가 방에 들어가셨다.')
# [('아버지', 'Noun'), ('가', 'Josa'), ('방', 'Noun'), ('에', 'Josa'), ('들어가셨다', 'Verb'), ('.', 'Punctuation')]
twitter.pos('아버지 가방에 들어가셨다.')
# [('아버지', 'Noun'), ('가방', 'Noun'), ('에', 'Josa'), ('들어가셨다', 'Verb'), ('.', 'Punctuation')]
twitter.pos('아버지가 방 안에 있는 가방에 들어가셨다.')
# [('아버지', 'Noun'), ('가', 'Josa'), ('방', 'Noun'), ('안', 'Noun'), ('에', 'Josa'), ('있는', 'Adjective'), ('가방', 'Noun'), ('에', 'Josa'), ('들어가셨다', 'Verb'), ('.', 'Punctuation')]
728x90
'데이터 분석 > Python' 카테고리의 다른 글
텍스트 마이닝 2 (0) | 2021.06.04 |
---|---|
Folium (0) | 2021.06.04 |
Chi-Square (카이제곱 검정) (0) | 2021.06.03 |
T-test (T-검정) (0) | 2021.06.03 |
Bootstrapping (부트스트래핑) (0) | 2021.06.03 |