Python 如何将.csv.gz编码更改为utf-8
我想使用R或Python将.csv.gz文件转换为utf-8编码。我怎样才能直接做到这一点?我找不到任何关于如何做到这一点的全面指南 我最好的尝试是用python中的Python 如何将.csv.gz编码更改为utf-8,python,r,csv,text,encoding,Python,R,Csv,Text,Encoding,我想使用R或Python将.csv.gz文件转换为utf-8编码。我怎样才能直接做到这一点?我找不到任何关于如何做到这一点的全面指南 我最好的尝试是用python中的csv.reader读取.csv.gz文件: csvFile = gzip.open('pracodawcy_20190611_5.csv.gz', 'rt', newline='') reader = csv.reader(csvFile) 但稍后如何使用utf-8将其保存为csv?非常简单,它将文件放入向量中: import
csv.reader
读取.csv.gz文件:
csvFile = gzip.open('pracodawcy_20190611_5.csv.gz', 'rt', newline='')
reader = csv.reader(csvFile)
但稍后如何使用utf-8将其保存为csv?非常简单,它将文件放入向量中:
import gzip
### assuming the file is separated as you said
with gzip.open('input_file.csv.gz', 'rt', newline='\n') as f:
content = f.readlines()
### to print the vector content
for v in content :
print(v)
### to write to .csv.gz
with gzip.open('output.csv.gz', 'wb') as f:
for v in content :
f.write(v.encode('utf-8'))
如果read()或for太大,也可以每行懒洋洋地打开它。这里和网上都有很多例子。好的,我知道如何打开,但是如何用utf-8正确保存为.csv.gz格式?