如何读取dask datfarame中的csv.deflate hdfs文件?

如何读取dask datfarame中的csv.deflate hdfs文件?,csv,hdfs,dask,deflate,Csv,Hdfs,Dask,Deflate,我正在尝试从hdfs路径读取csv.deflate文件,并将它们放入dask数据帧中。我尝试读取_csv,但发现“UnicodeDecodeError:'utf-8'编解码器无法解码位置1中的字节0x9c:无效的开始字节”错误。然后,我设置了engine='python'和encoding='utf-8',但仍然得到相同的错误。也许compression=关键字会有所帮助?您将如何通过熊猫在本地读取这些数据?我怀疑您需要与在这种情况下相同的关键字参数

我正在尝试从hdfs路径读取csv.deflate文件,并将它们放入dask数据帧中。我尝试读取_csv,但发现“UnicodeDecodeError:'utf-8'编解码器无法解码位置1中的字节0x9c:无效的开始字节”错误。然后,我设置了engine='python'和encoding='utf-8',但仍然得到相同的错误。

也许compression=关键字会有所帮助?您将如何通过熊猫在本地读取这些数据?我怀疑您需要与在这种情况下相同的关键字参数