본문 바로가기
공부/Python

[python] pandas를 활용한 간단한 csv to tsv 또는 tsv to csv

by 병진들 2021. 9. 28.

csv파일과 tsv의 차이를 굳이 두자면 데이터의 구분자(delimiter) "콤마(,)" 인지 "탭(\t)" 인지 이다.

 

자주 사용하게 되는데, 자꾸 까먹고 다시 검색해보는게 싫어서 간단하게 기록한다.

아래는 pandas를 사용하여 csv를 tsv파일로 변환하는 것이다.

import pandas as pd

# delimiter가 콤마(,)로 된 csv파일을 불러온 후(한글이라 인코딩은 utf-8 사용)
df = pd.read_csv('train_data.csv', sep = ",", engine='python', encoding = "utf-8")

# 그냥 혹시 있을 결측치 제거..
df.dropna(axis=0)

# delimeter를 탭(\t)으로 변경 후 저장.
df.to_csv('m_train.tsv', sep='\t',encoding = "utf-8", index=False)

 

 

댓글