코드
from bs4 import BeautifulSoup
import urllib.request
def top_word():
word_list = []
url = 'https://www.naver.com/'
sourcecode = urllib.request.urlopen(url).read()
soup = BeautifulSoup(sourcecode, 'html.parser')
soup = soup.find('ul', 'ah_l')
for i in soup.find_all('span', 'ah_k'):
word_list.append(i.get_text())
return word_list
word_list = top_word()
for i in range(len(word_list)):
print('#{0} : {1}'.format(i+1, word_list[i]))
결과
#1 : 최욱
#2 : 이상미
#3 : 안다르 t데이
#4 : 볼보 s60
#5 : 여중생a
#6 : 와우 클래식
#7 : 근로장려금 자격요건
#8 : 윤석열
#9 : 뽀로로
#10 : 자녀장려금
#11 : 나혼자산다 화사빗
#12 : 한혜연 클렌징밤
#13 : 2019 볼보 s60
#14 : 성유리 남편
#15 : 위대한 쇼
#16 : s60
#17 : 홍가혜
#18 : 변상욱앵커
#19 : 조국힘내세요
#20 : 아는 와이프
크론 돌려서 쿠버네티스에서 시도해볼거다.
'Python > Crawler' 카테고리의 다른 글
Python - 네이버 지도 API를 이용하여 서브웨이 지도 만들기 (1) | 2019.06.25 |
---|---|
Beautiful Soup Documentation (0) | 2019.06.19 |
우리 지역의 성범죄자는 몇 명이나 될까? (1) - python을 이용한 크롤링, 시각화 (0) | 2019.04.29 |
네이버 블로그를 크롤링하여 단어 빈도 분석하기 (0) | 2019.04.03 |
Python과 Google API를 이용하여 인스타그램 크롤링 이후 이미지를 분석해보기 (0) | 2019.03.19 |