Python 初始化dask系列

Python 初始化dask系列,python,pandas,dask,Python,Pandas,Dask,我试图在dask数据帧中添加一列,但它不允许我添加列表类型的列,所以我做了一点尝试,发现它可以添加一个dask系列。但是,我无法将我的列表转换为dask系列。您能帮我吗?如果列表适合内存,您可以将其转换为数据帧: import pandas as pd import dask.dataframe as dd import numpy as np df = pd.DataFrame(np.random.random_integers(0,6,size=(20, 6)), columns=

我试图在dask数据帧中添加一列,但它不允许我添加列表类型的列,所以我做了一点尝试,发现它可以添加一个dask系列。但是,我无法将我的列表转换为dask系列。您能帮我吗?

如果列表适合内存,您可以将其转换为数据帧:

import pandas as pd  
import dask.dataframe as dd  
import numpy as np

df = pd.DataFrame(np.random.random_integers(0,6,size=(20, 6)),
columns=list('ABCDEF'))   data = dd.from_pandas(df, npartitions = 2)

listadd = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17,18, 19, 20] 
listadd = pd.DataFrame(listadd)

data[['G']] = listadd

print data.compute()

dask.dataframe.from_pandas(pandas.Series(my_data),npartitions=n)
是您所需要的
from_pandas
接受这两个
pandas.DataFrame/Series

如果您提供了预期工作的代码的全部细节,以及失败的方式,则会更好:代码和错误/回溯。是的,但它不适合:/列表适合,但数据帧不适合?是的,列表适合,仅占RAM的75%左右,但数据帧不适合,而使用Pandas时,列表来自哪里?您可以直接从csv或其他格式加载它吗?请参阅:
dd.from_pandas
也适用于该系列。在该方法内创建一个
pd.Series