티스토리 뷰

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
import requests
from bs4 import BeautifulSoup
 
req = requests.get("https://www.naver.com/"# connection
html = req.text # 소스 가져오기
 
# BEautifulSoup로 html 소스를 python 객체로 변경할 수 있다.
# 첫 인자에는 html소스코드를, 두 번째 인자에는 어떤 parser를 이용할지 정해줌
 
# python 내장 함수 html.parser
soup = BeautifulSoup(html,'html.parser')
sillsigan = soup.select('div.ah_roll.PM_CL_realtimeKeyword_rolling_base > div > ul > li'
# 실시간 검색어 부분 copy select
 
= []
for sill in sillsigan:
    b.append(sill.text) # 태그 내 문자열을 b리스트에 추가
 
= 1;
list_sillsigan=[]
print ("="*30+'\n'+" "*5+"baobob 네이버 실시간\n"+"="*30)
for i in b:    # 문자열에서 핵심 문자열만 list_sillsigan 리스트에 추가
 
    if k>9 :
        list_sillsigan.append(i[5:-2]) 
    else :
        list_sillsigan.append(i[4:-2])
    k += 1
 
for s, list in enumerate(list_sillsigan): 
# enumerate를 이용하면 s는 개수를 셀 수 있고 list는 리스트 요소에 접근 가능
    print (" %d위 "%(s+1)+list) # 출력
cs


Comments