Dask eror-min()arg是一个空序列

Dask eror-min()arg是一个空序列,dask,Dask,我正试图使用Dask来处理一个相当大的数据集,但我一直在 ValueError:min()参数是空序列 当我尝试运行.descripe().compute()时 我已经用相同的数据集确认了正常熊猫的描述工作,因此它必须与dask相关 以下是我正在使用的行: inpFile=dd.read\u csv(fPath,sep='\t',error\u bad\u lines=False,quoting=csv.QUOTE\u NONE) 完全错误是: ValueError回溯(最近的调用 最后)在()

我正试图使用Dask来处理一个相当大的数据集,但我一直在

ValueError:min()参数是空序列

当我尝试运行.descripe().compute()时

我已经用相同的数据集确认了正常熊猫的描述工作,因此它必须与dask相关

以下是我正在使用的行: inpFile=dd.read\u csv(fPath,sep='\t',error\u bad\u lines=False,quoting=csv.QUOTE\u NONE)

完全错误是:

ValueError回溯(最近的调用 最后)在() ---->1 inpFile.descriple().compute()文件 2#inpFile2.descripe()

/home/badrul/anaconda3/lib/python3.6/site-packages/dask/dataframe/core.py 在描述中(自我、分割)1306个数字= self.\u获取\u数值\u数据()1307 ->1308统计数据=[num.count(split\u every=split\u every),1309 num.mean(split\u every=split\u every),1310
num.std(分割间隔=分割间隔)

/home/badrul/anaconda3/lib/python3.6/site-packages/dask/dataframe/core.py 计数中(自身、轴、分割间隔)1191
令牌=令牌,拆分间隔=拆分间隔)1192如果 iInstance(自身、数据帧): ->1193 result.divisions=(最小值(自列),最大值(自列))1194返回结果1195

ValueError:min()参数是空序列

虽然它不会运行很长时间,所以我怀疑它没有加载。 当我执行以下操作时,就会出现错误:inpFile.descriple().compute()


您可以发布
df.dtypes
的输出吗?或者只检查您的所有数据类型是否都是
object
列吗?dask.dataframe.description中可能有一个bug,无法处理所有非数字列。是的,我得到的是:user_000001object 2009-05-04T23:08:57Z object f1b1cf71-bd35-4e99-8624-24a6e15f133a对象深碟对象未命名:4对象我很有名(帕查伊维萨)-09-28-2007对象数据类型:对象我正在处理的文件是这样的:好的,所以我发现这个命令似乎根本不适用于1行组成的数据,都是数字。例如,1,2,3,4(我尝试从制表符分隔切换到逗号分隔,看看这是否也有区别)我打开来跟踪这一点。仅供参考,数据类型用于整个列,因此仅更改一行不会修复任何问题。您可以发布
df.dtypes
?的输出吗?或者只检查您的所有数据类型是否都是
object
列?dask.dataframe.description中可能有一个错误,无法处理所有非数字列。是的,我得到了:user\u000001对象2009-05-04T23:08:57Z对象f1b1cf71-bd35-4e99-8624-24a6e15f133a对象深碟对象未命名:4对象我很有名(帕查伊维萨)-09-28-2007对象数据类型:对象我正在处理的文件是这样的:好的,所以我发现这个命令似乎根本不适用于1行组成的数据,都是数字。例如,1,2,3,4(我尝试从制表符分隔切换到逗号分隔,看看这是否也有区别)我打开以跟踪此内容。仅供参考,数据类型用于整个列,因此仅更改一行并不能解决任何问题。