파이썬 BeautifulSoup를 이용해 네이버 실시간 검색어 웹 크롤러 만들기

티스토리 뷰

programming/python

파이썬 BeautifulSoup를 이용해 네이버 실시간 검색어 웹 크롤러 만들기

ba0bab 2018. 3. 5. 19:54

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
import requests
from bs4 import BeautifulSoup
 
req = requests.get("https://www.naver.com/") # connection
html = req.text # 소스 가져오기
 
# BEautifulSoup로 html 소스를 python 객체로 변경할 수 있다.
# 첫 인자에는 html소스코드를, 두 번째 인자에는 어떤 parser를 이용할지 정해줌
 
# python 내장 함수 html.parser
soup = BeautifulSoup(html,'html.parser')
sillsigan = soup.select('div.ah_roll.PM_CL_realtimeKeyword_rolling_base > div > ul > li') 
# 실시간 검색어 부분 copy select
 
b = []
for sill in sillsigan:
    b.append(sill.text) # 태그 내 문자열을 b리스트에 추가
 
k = 1;
list_sillsigan=[]
print ("="*30+'\n'+" "*5+"baobob 네이버 실시간\n"+"="*30)
for i in b:    # 문자열에서 핵심 문자열만 list_sillsigan 리스트에 추가
 
    if k>9 :
        list_sillsigan.append(i[5:-2]) 
    else :
        list_sillsigan.append(i[4:-2])
    k += 1
 
for s, list in enumerate(list_sillsigan): 
# enumerate를 이용하면 s는 개수를 셀 수 있고 list는 리스트 요소에 접근 가능
    print (" %d위 "%(s+1)+list) # 출력
Colored by Color Scripter
cs

'programming > python' 카테고리의 다른 글

angr 정리 (0)	2018.07.07
z3 정리 (0)	2018.07.07
파이썬 requests 모듈 기본 (0)	2018.03.05
[python] request를 이용한 get값 브루트포싱 (0)	2017.12.20
[교육봉사][동아리 활동][python]마인크래프트로 배우는 파이썬 프로그래밍 (0)	2017.12.17

공유하기 링크

Comments

Related Articles more

최근에 올라온 글

최근에 달린 댓글

TAG more

Total

Today

Yesterday

티스토리 뷰

파이썬 BeautifulSoup를 이용해 네이버 실시간 검색어 웹 크롤러 만들기

'programming > python' 카테고리의 다른 글

티스토리툴바