Python 从dask数据帧中删除有问题的列

Python 从dask数据帧中删除有问题的列,python,pandas,dataframe,dask,Python,Pandas,Dataframe,Dask,我有一个dask数据帧,其中有一个有问题的列(我相信)是某个特定错误的来源,每当我尝试对数据帧执行任何操作时(无论是head,还是to_csv,甚至当我尝试使用(不同的)子集时,都会抛出该错误列。该错误可能是由于数据类型不匹配造成的,如下所示: ValueError: invalid literal for int() with base 10: 'FIPS' 所以我决定使用 现在当我做df.columns时,我再也看不到'FIPS',我认为这意味着它确实被删除了。但是当我尝试将不同的列写入文

我有一个
dask
数据帧,其中有一个有问题的列(我相信)是某个特定错误的来源,每当我尝试对数据帧执行任何操作时(无论是
head
,还是
to_csv
,甚至当我尝试使用(不同的)子集时,都会抛出该错误列。该错误可能是由于数据类型不匹配造成的,如下所示:

ValueError: invalid literal for int() with base 10: 'FIPS'
所以我决定使用

现在当我做
df.columns
时,我再也看不到
'FIPS'
,我认为这意味着它确实被删除了。但是当我尝试将不同的列写入文件时

df.column_a.to_csv('example.csv')
我总是犯同样的错误

ValueError: invalid literal for int() with base 10: 'FIPS'
我认为这与
dask
的惰性方法有关,因此它会延迟删除,但任何解决方法都会非常有用


基本上,我只需要从
df
中提取一个列(
column\u a
),并在删除后尝试转换为数据帧

df.compute()

然后才写入csv

您是否考虑过使用列式formar作为
拼花
?这样您就可以只读取所需的COL。您是否有完整的示例?有时,如果DAG被缓存并损坏,您可能需要重新启动内核/客户端以重新运行
df.compute()