csv파일과 tsv의 차이를 굳이 두자면 데이터의 구분자(delimiter)가 "콤마(,)" 인지 "탭(\t)" 인지 이다.
자주 사용하게 되는데, 자꾸 까먹고 다시 검색해보는게 싫어서 간단하게 기록한다.
아래는 pandas를 사용하여 csv를 tsv파일로 변환하는 것이다.
import pandas as pd
# delimiter가 콤마(,)로 된 csv파일을 불러온 후(한글이라 인코딩은 utf-8 사용)
df = pd.read_csv('train_data.csv', sep = ",", engine='python', encoding = "utf-8")
# 그냥 혹시 있을 결측치 제거..
df.dropna(axis=0)
# delimeter를 탭(\t)으로 변경 후 저장.
df.to_csv('m_train.tsv', sep='\t',encoding = "utf-8", index=False)
'공부 > Python' 카테고리의 다른 글
[pandas] 대한민국 주소체계 분리해서 사전만들기 (0) | 2021.07.09 |
---|---|
[python] pyinstaller centOS에서 빌드하기(docker) (0) | 2021.06.25 |
[python] pyinstaller jinja2.PackageLoader Error (0) | 2021.06.24 |
[python] pyinstaller 와 빌드 후 ini 환경변수 읽기(konfig) (1) | 2021.06.19 |
[python] pyinstaller 일곱번의 삽질 for uvicorn + FastAPI (1) | 2021.06.18 |
댓글