본문 바로가기

Python/Crawler

네이버 실시간 검색어 크롤링 코드

코드

from bs4 import BeautifulSoup
import urllib.request


def top_word():
    word_list = []
    url = 'https://www.naver.com/'
    sourcecode = urllib.request.urlopen(url).read()
    soup = BeautifulSoup(sourcecode, 'html.parser')
    soup = soup.find('ul', 'ah_l')
    for i in soup.find_all('span', 'ah_k'):
        word_list.append(i.get_text())
    return word_list


word_list = top_word()

for i in range(len(word_list)):
    print('#{0} : {1}'.format(i+1, word_list[i]))

결과

#1 : 최욱
#2 : 이상미
#3 : 안다르 t데이
#4 : 볼보 s60
#5 : 여중생a
#6 : 와우 클래식
#7 : 근로장려금 자격요건
#8 : 윤석열
#9 : 뽀로로
#10 : 자녀장려금
#11 : 나혼자산다 화사빗
#12 : 한혜연 클렌징밤
#13 : 2019 볼보 s60
#14 : 성유리 남편
#15 : 위대한 쇼
#16 : s60
#17 : 홍가혜
#18 : 변상욱앵커
#19 : 조국힘내세요
#20 : 아는 와이프

크론 돌려서 쿠버네티스에서 시도해볼거다.