Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- Kaggle
- 빅분기
- python3
- sklearn
- 파이썬
- 카카오
- seaborn
- 실습
- oracle
- level 2
- level 1
- Python
- Oracel
- matplotlib
- 빅데이터 분석 기사
- 데이터 분석
- pandas
- 튜닝
- 알고리즘
- R
- 실기
- 프로그래머스
- 코딩테스트
- 머신러닝
- Numpy
- 오라클
- SQL
Archives
- Today
- Total
라일락 꽃이 피는 날
[Python] selenium 본문
728x90
selenium
웹페이지 테스트 자동화용 모듈이다.
개발/테스트용 드라이버(웹브라우저)를 사용하여 실제 사용자가 사용하는 것처럼 동작한다.
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
from bs4 import BeautifulSoup
import time
1. python.org로 이동하여 자동으로 검색
chrome_driver = 'chromedriver 경로'
driver = webdriver.Chrome(chrome_driver)
driver.get('https://www.python.org/')
search = driver.find_element_by_id('id-search-field')
time.sleep(2)
search.clear()
time.sleep(2)
search.send_keys("lambda")
time.sleep(2)
search.send_keys(Keys.RETURN)
time.sleep(2)
driver.close()
2. 다음뉴스 웹사이트 크롤링
chrome_driver = 'chromedriver 경로'
driver = webdriver.Chrome(chrome_driver)
url = 'https://news.v.daum.net/v/20210821112100211'
driver.get(url)
src = driver.page_source
soup = BeautifulSoup(src)
comment = soup.select_one('span.alex-count-area')
driver.close()
comment.get_text()
3. 특정 element의 로딩 대기
chrome_driver = 'chromedriver 경로'
driver = webdriver.Chrome(chrome_driver)
url = 'https://news.naver.com/main/read.naver?mode=LSD&mid=shm&sid1=100&oid=005&aid=0001465638'
driver.get(url)
WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.CSS_SELECTOR, 'em.simplecmt_num')))
src = driver.page_source
soup = BeautifulSoup(src)
comment = soup.select_one('em.simplecmt_num')
driver.close()
comment.get_text()
728x90
'프로그래밍 > Python' 카테고리의 다른 글
[Python] zip (0) | 2021.10.11 |
---|---|
[Python] ASCII (아스키 코드) (0) | 2021.10.11 |
[Python] BeautifulSoup (0) | 2021.08.22 |
[Python] Open API (0) | 2021.08.22 |
[Python] requests (0) | 2021.08.22 |