본문 바로가기

Python12

[pandas] 대한민국 주소체계 분리해서 사전만들기 일반적인 문서(docx, pdf, pptx ... )에서 주소를 찾아야 하는 일이 생겼다. 공수가 많이 들어갈 것 같은 작업이라 미뤘지만 이제는 미룰 수 없는.. 근데 생각보다 빨리 잘 끝났다. https://www.juso.go.kr/addrlink/addressBuildDevNew.do?menu=mainJusoDb 도로명주소 DB 다운로드 | 도로명주소 개발자센터 www.juso.go.kr 위 사이트에서 대한민국 주소 데이터베이스를 다운받을 수 있었다. (우리나라도 요즘 잘해놓네...) 내가 필요한 정보는 우리나라의 도로명, 시도명, 시군구명, 읍면동명 이렇게 네가지였고 다운받은 DB를 찾아보니 적절히 분류된게 있어서 사이트에서 제공해준 [가이드]를 참고해 전처리 하였다. 전처리한 DB는 '개선_도로.. 2021. 7. 9.
[python] 프로그래머스 코딩테스트 연습 HASH level3 (기록용) 오랜만에 코딩테스트 문제를 풀어봤다.. 직장동료가 이직준비를 하면서 갑자기 이거 풀어보라고 URL을 던져서.. 결론부터 말하면 다행히 푸는데 성공했다...ㅎㅎ (쉬운문제이긴함...) 문제 설명 더보기 스트리밍 사이트에서 장르 별로 가장 많이 재생된 노래를 두 개씩 모아 베스트 앨범을 출시하려 합니다. 노래는 고유 번호로 구분하며, 노래를 수록하는 기준은 다음과 같습니다. 속한 노래가 많이 재생된 장르를 먼저 수록합니다. 장르 내에서 많이 재생된 노래를 먼저 수록합니다. 장르 내에서 재생 횟수가 같은 노래 중에서는 고유 번호가 낮은 노래를 먼저 수록합니다. 노래의 장르를 나타내는 문자열 배열 genres와 노래별 재생 횟수를 나타내는 정수 배열 plays가 주어질 때, 베스트 앨범에 들어갈 노래의 고유 번.. 2021. 6. 29.
[python] 클래스를 함수처럼 사용할수 있게.. __call__함수 python memoize를 공부하다가 __call__함수에 대해 먼저 확실하게 이해하고 가려고 정리 하게 되었다. __call__ 이 함수는 클래스의 객체를 호출할 수 있게 만드는 함수이다. class Callmsg: def __init__(self): self.msg = "__call__ Test" # 아래 함수를 클래스에 추가 def __call__(self): return self.msg 위와 같은 __call__객체를 가진 class가 있을 때, __init__에서 msg변수에 문자열(__call__ Test)을 할당해 주고 일반적인 방법으로 msg를 출력하는 방법은 아래와 같다. obj = Callmsg() print(obj.msg) # '__call__ Test' 하지만 __call__ 함수.. 2021. 6. 15.
[python] opencv를 활용한 이미지에서 표 객체 찾기(table detection) 원래 corner detect를 찾아보다가 sift, harris 알고리즘 같은걸 보고 이 알고리즘 들은 table detect에 활용이 잘 안돼서 아에 box detect 하는 방법을 찾게되었다. 이 글은 기록용.. 아래 사진에서 표 부분만 좌표를 구할 것이다 필요 Library import cv2 import numpy as np Image Binaray gray_scale=cv2.cvtColor(image,cv2.COLOR_BGR2GRAY) _,img_bin = cv2.threshold(gray_scale,150,225,cv2.THRESH_BINARY) img_bin=~img_bin 표에 컬러가 있을 수 있으니 먼저 gray_scale로 변환하고, 이진화시킴 이진화된 이미지를 반전(~) 시켜주면 아.. 2021. 5. 31.