Pytorch 在torchtext中读取csv.gz文件

Pytorch 在torchtext中读取csv.gz文件,pytorch,torch,torchtext,Pytorch,Torch,Torchtext,熊猫的read_csv也适用于csv.gz 有没有办法用Pytork实现类似的效果?似乎没有这样的选项。TLDR:不,tablerdataset不支持此选项。 使用 建议使用gzip.open打开文件,csv.reader可以读取该文件 但是,TablerDataset要求的是文件路径,而不是文件指针,因此深入到 io.open(os.path.expanduser(path), encoding="utf8") 打开文件路径。由于.gz不是utf8,因此无法正确读取文件。感谢您的详细回答和解

熊猫的read_csv也适用于csv.gz


有没有办法用Pytork实现类似的效果?似乎没有这样的选项。

TLDR:不,tablerdataset不支持此选项。

使用

建议使用
gzip.open打开文件,csv.reader可以读取该文件

但是,TablerDataset要求的是文件路径,而不是文件指针,因此深入到

io.open(os.path.expanduser(path), encoding="utf8")

打开文件路径。由于.gz不是utf8,因此无法正确读取文件。

感谢您的详细回答和解释!似乎没有办法将文件对象传递给它。torch中有没有类似的功能可以使用?您只需复制TablerDataset的源代码并替换文件打开行即可。