본문 바로가기

Python/Default

yaml 파일 요소 뽑아내기 import yaml import pprint def print_instance(filename): with open(filename) as f: conf = yaml.load(f) temp = conf['instance_groups'] instance = [] for i in temp: deployments = [] deployments.extend([i['name'], i['instances'], i['vm_type']]) instance.append(deployments) return instance filename = 'D:\deployment\paasta-deployment\paasta-deployment.yml' pprint.pprint(print_instance(filename)) paas-..
Kaggle에서 한글 폰트 사용하기 이런 저런 방법이 있겠지만 나는 가장 간단한 방법으로 했다. 데이터 셋에 폰트를 넣어준다. # This Python 3 environment comes with many helpful analytics libraries installed # It is defined by the kaggle/python docker image: https://github.com/kaggle/docker-python # For example, here's several helpful packages to load in import numpy as np # linear algebra import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv) import ma..
NASA Dataset을 이용하여 predictive - maintenance 하기 전 데이터 살펴보기 MES는 Manufacturing Execution System의 약자라지만 나한테는 욕의 약자처럼 느껴지는데..^^! 블로그니까 착한 말만 하기로 하자. 제조업이나 기계쪽은 관련 데이터셋을 찾기가 쉽지 않아 구글링하고 X100 또 하다가 그래도 한 번 해볼만한 데이터셋을 찾게 되었다. 캘리포니아에 사시는 김에버슨님이 작성해주신 자료이다. 깃의 주소는 여기로 간다. 김에버슨님이 작성한 글은 여기에서 본다. 예제는 NASA에서 제공되는 Turbofan Engine Degradation Simulation data set으로 진행된다. 나사 홈페이지 가면 받을 수 있을 것처럼 보이지만 천만의 말씀 만만의 콩떡. URL이 소실된지 오래이므로 잘 검색해서 받아준다. 받아서 압축을 풀면 이런 문서가 있다. (물론..
Python 교육 1일차 프로그래밍 언어의 특징 1. 인터프리터 2. 문법 3. 개발툴 Data / 함수 / 객체 - 파이썬은 모든 것이 객체이다 - Data의 자료형 > List : 데이터의 중간 결과 저장(임시 저장), 분석 결과물 저장 용도 > Tuple : 메인 함수에 여러 개의 인자를 넣을 때 (*Tuple 형식으로) key 없이 value만 모아서 쓴 것이 튜플 > Set : (Lookup table) key만 모아둔 것. > Dict : key/value로 존재. key는 고유한 단어로 존재하며 value는 key가 의미하는 내용. Dict = Set(key) + Tuple(Value) Temp(dict) = List - 객체(Class의 Instance) > int, float 이런 것들은 다 원형 class가 있..
Python PDF extract tool 정리 언어의 한계상 대부분이 그렇듯 영어는 인식률이 높지만 한글은 아직 발전해야 할 부분이 많다. 1. OCR_SPACE def ocr_space(filename, overlay=False, api_key='', language='eng'): payload = {'isOverlayRequired': overlay, 'apikey': api_key, 'language': language, } with open(filename, 'rb') as f: r = requests.post('https://api.ocr.space/parse/image', files={filename: f}, data=payload, ) return r.content.decode() 서비스는 웹에서 돌아가고 API를 통해 사용할 수 있다...
Pyspc를 사용하여 SPC Graph 그리기 2019/05/09 - [계약/SIDE] - Statistical Process Control (SPC) 갑자기 하늘에서 떨어져 내게 온 SPC를 세미 체험해보기 위해 Python을 켰다. SPC에 관련된 내용은 이전 글을 읽자. 그리 어려운 내용은 아니고 그저 내가 원하는 조건에서 벗어나는 친구들이 생기는지 생기지 않는지 감시하는 용도로 간단히 생각하면 될 듯 하다. Python님은 못가진거빼고 다 가지고 계시기 때문에 검색을 통해 라이브러리를 찾아본다. 역시 사귄지 얼마안된 내 친구 파이썬은 원하는 라이브러리가 있었다. 감사한 분에게 인사드리며 pyspc 라이브러리는 다음 주소로 찾아가면 된다. 제공하는 차트는 아래와 같다. pip install pyspc 마법의 주문으로 새로운 라이브러리를 맞이해준..
CentOS7에서 Oracle 연동 오류 cx_Oracle.DatabaseError: DPI-1047: Cannot locate a 64-bit Oracle Client library: "libclntsh.so: cannot open shared object file: No such file or directory". See https://oracle.github.io/odpi/doc/installation.html#linux for help 1. Oracle Client를 설치한다. [이 곳]에서 받을 수 있다. 2. unzip 명령어로 압축을 해제한다. 3. libaio를 다운로드 받는다. 4. 적당한 위치로 옮긴다. 5. PATH에 등록해준다. 6. DB 연결정보를 담고 있는 tnsname.ora 파일을 만들어주고 PATH에 등록한다. #..