Pandas 莫丁与达斯克发生冲突

Pandas 莫丁与达斯克发生冲突,pandas,dask,modin,Pandas,Dask,Modin,我正在尝试莫丁,但不断出现错误: import modin.pandas as md import pandas as pd PATH = 'file.csv' %%time df = pd.read_csv(PATH) %%time mdf = md.read_csv(PATH) 错误: UserWarning:Dask执行环境尚未初始化。正在初始化。。。 要删除此警告,请在执行数据帧操作之前运行以下python代码: 从未检索到任务异常 未来: 回溯(最近一次呼叫最后一次): 文件“

我正在尝试莫丁,但不断出现错误:

import modin.pandas as md
import pandas as pd

PATH = 'file.csv'

%%time
df = pd.read_csv(PATH)

%%time
mdf = md.read_csv(PATH)
错误:

UserWarning:Dask执行环境尚未初始化。正在初始化。。。 要删除此警告,请在执行数据帧操作之前运行以下python代码:

从未检索到任务异常 未来: 回溯(最近一次呼叫最后一次): 文件“C:\Users\Oleg\AppData\Local\Programs\Python\Python39\lib\asyncio\tasks.py”,第690行,在“wrap\u waitible”中 回报(等待的收益。等待()) 文件“C:\Users\Oleg\AppData\Local\Programs\Python\Python39\lib\site packages\distributed\core.py”,第290行,在_ 等待self.start() 文件“C:\Users\Oleg\AppData\Local\Programs\Python\39\lib\site packages\distributed\nanny.py”,第295行,在开始处 response=wait self.instantiate() 文件“C:\Users\Oleg\AppData\Local\Programs\Python\39\lib\site packages\distributed\nanny.py”,第378行,在实例化中 结果=等待self.process.start() 文件“C:\Users\Oleg\AppData\Local\Programs\Python\39\lib\site packages\distributed\nanny.py”,第575行,在开始处 等待self.process.start() 文件“C:\Users\Oleg\AppData\Local\Programs\Python\Python39\lib\site packages\distributed\process.py”,第34行,在调用和设置中 res=func(*args,**kwargs) 文件“C:\Users\Oleg\AppData\Local\Programs\Python\39\lib\site packages\distributed\process.py”,第202行,在\u start中 process.start() 文件“C:\Users\Oleg\AppData\Local\Programs\Python\Python39\lib\multiprocessing\process.py”,第121行,在开始处 self.\u popen=self.\u popen(self) 文件“C:\Users\Oleg\AppData\Local\Programs\Python\39\lib\multiprocessing\context.py”,第224行,在\u Popen中 返回_default_context.get_context().Process._Popen(Process_obj) 文件“C:\Users\Oleg\AppData\Local\Programs\Python\39\lib\multiprocessing\context.py”,第326行,在\u Popen中 从.popen\u spawn\u win32导入popen ImportError:无法从部分初始化的模块“multiprocessing.Popen\u spawn\u win32”导入名称“Popen”(很可能是由于循环导入)(C:\Users\Oleg\AppData\Local\Programs\Python\Python39\lib\multiprocessing\Popen\u spawn\u win32.py) '''

我有一个popen版本0.1.20,如果它有任何帮助的话。 SO上有人建议尝试错误消息中的东西-导入dask.distributed并启动客户端,但没有帮助

非常感谢您的帮助


另外,几周前我想尝试一下modin,但安装一点也不简单,有很多错误,主要是光线和dask导入。我设法让达斯克工作,而不是莫丁。并开始学习它的api。现在我决定再试一次,因为我认为dask工作得很好,但是没有,仍然有一些导入错误和其他错误。

莫丁似乎正在自动创建一个dask本地进程集群。不幸的是,它们中的每一个都在导入您的脚本,以便能够理解定义的变量,并且它们还试图启动一个新的dask本地集群

您应该尝试将代码放入函数中,并从受

if __name__ == "__main__":
if __name__ == "__main__":