Python 数据帧多线程

Python 数据帧多线程,python,multithreading,pandas,Python,Multithreading,Pandas,我有一个代码,我想使用它并行运行 df1["ColA"] = df.apply(lambda rows: func(rows[0], rows[1], row[2]), axis=1) df1["ColB"] = df.apply(lambda rows: func(rows[0], rows[3], row[4]), axis=1) df1["ColC"] = df.apply(lambda rows: func(rows[0], rows[5], row[6]), axis=1) 这是代码

我有一个代码,我想使用它并行运行

df1["ColA"] = df.apply(lambda rows: func(rows[0], rows[1], row[2]), axis=1)
df1["ColB"] = df.apply(lambda rows: func(rows[0], rows[3], row[4]), axis=1)
df1["ColC"] = df.apply(lambda rows: func(rows[0], rows[5], row[6]), axis=1)
这是代码的一部分。数据帧df中有超过100k行,func的每个操作都需要大量时间,因此我想并行化该任务

现在,我正在开发jupyter笔记本(作为anaconda 2的一部分),我尝试的任何多线程代码都失败了。作为示例,我尝试使用和以及其他一些示例,但所有这些示例都在windows和linux上被卡住了

有人能帮忙吗

--

编辑:我在windows上收到的错误消息之一是

AttributeError:'模块没有属性'rand_string'


如果熊猫的知识是必要的,你可能想考虑添加一个标签。我会添加标签,但我不认为熊猫的知识是必要的,因为几乎没有什么改变熊猫的角度。也许有一个更好的解决方案比运行多处理模块。发布您的数据帧和具有所需结果的数据帧,并可能找到矢量化的实现。@TEDPROU就数据帧而言,就是这样。我使用read_table命令从文件中加载数据,运行上面的3行并返回数据帧df1。就这样。