본문 바로가기

D3.js 를 사용하여 그래프 그리기 D3.js를 사용하여 그래프 그리기 세상엔 알아야 할 것들이 너무나 많다. 그 중 하나가 전공지식 아닐까? 여태 배웠는데 아침에 눈을 뜨면 또 배울 것들이 태산이다. 요즘 하는 데이터 크롤링에게 필연적으로 따라오는 요소가 시각화이다. 파이썬에서 갖가지 기능들을 제공하고 있지만, 스터디 분야가 웹이였기 때문에 D3.js로 도전해봤다. 참고로 엄청나게 많은 추측들을 담고 있는 글이다. 1. 데이터 수집 만만한게 기상데이터다. 자료도 많고 표현할 수 있는 방법도 많다. 서울열린데이터에서 제공하고 있는 서울특별시 관측소별 기상관측 정보(시간단위) 데이터를 사용하였다. 고맙게도 API를 제공하고 있어 쉽게 가져올 수 있다. 나는 구로구의 데이터를 json으로 한 시간마다 가져와 rect 형식으로 추가해주는 그래프..
NLTK 라이브러리 사용 중간에 멈춤 현상 트위터 분석을 하다가 어떤 구간에서 라이브러리가 작동하지 않는 것을 알게 되었다. 스트링도 쪼개보고 한 트윗씩도 해보고 하다가 문제점을 찾게 되었다. Notepad기준으로 나타나는 결과는 Process finished with exit code -1073740940 (0xC0000374) 값이다. 문제점은 트윗 속에 있는 이모티콘으로 이모티콘들을 제거하면 작동이 잘 된다. 훌륭하신 분이 해결법을 만들어 놓았다. https://github.com/konlpy/konlpy/issues/215
Python에서 matplotlib 사용시 한글 폰트 출력하기 Python에서 시각화 작업을 하다보면 영어가 아닌 한글을 출력해야 하는 경우가 있다. 이 때에 다음과 같이 사용해준다. 기준은 윈도우 10이다. from matplotlib import font_manager, rc plt.rcParams['axes.unicode_minus'] = False fontpath = "C:/Windows/Fonts/malgun.ttf" font_name = font_manager.FontProperties(fname=fontpath).get_name() rc('font',family=font_name) #한글 폰트 사용하기 위한 세팅 사용해보면 한글이 깨지지 않는 것을 확인할 수 있다.
Python을 기반으로 정부 API를 사용하여 Json 파일 처리하기 API(json) with Python 대용량 데이터의 자료 관리 기술과 자료 분석 기술이 중요해지는 가운데 공공데이터포털과 같은 정부 사이트에서 공공기관이 생성 또는 취득하여 관리하고 있는 공공데이터를 제공하고 있다. 쉽고 편리하게 이용이 가능하도록 공공데이터를 파일데이터, 오픈 API, 시각화 등으로 제공하고 있으며 누구나 이용이 가능하며 영리 목적의 이용을 포함한 자유로운 활용이 보장된다. 이 위키에서는 데이터의 수월한 활용을 위하여 Python을 기반으로 오픈 API를 사용해보고 Json 데이터를 처리해본다. 1. Python 환경설정 Python 환경설정은 [해당 페이지](Python 환경설정)에 분류되어 있다. 2. 오픈 API 2.1 오픈 API란? API는 Application Progra..
Python 설치 및 환경설정 Python 환경설정 1. Python 1991년에 발표된 인터프리터 방식의 프로그래밍 언어. 공식페이지 2. Python 설치 파이썬 공식 홈페이지의 다운로드 페이지에서 최신 버전을 운영체제에 맞게 다운로드 받는다. 다운 받은 exe 파일을 실행 후 "Install Now"를 선택해 설치를 진행한다. 이 때, Add Python 3.7 to PATH를 클릭 해 PATH가 등록될 수 있도록 한다. 설치 완료 후 시작 -> 모든 프로그램 -> Python을 확인한다. 3. 환경변수 설정 설치과정에서 환경변수를 추가하지 못했거나, 수정하고 싶은 경우가 생길경우 다음 과정을 따라가면 된다. 윈도우 > 시스템을 클릭한다. 정보 > 시스템 정보를 클릭한다. 고급 시스템 설정을 클릭한다. 시스템 속성 > 환경변수를..