Python 数据帧多线程_Python_Multithreading_Pandas

Python 数据帧多线程

python multithreading pandas

Python 数据帧多线程,python,multithreading,pandas,Python,Multithreading,Pandas,我有一个代码，我想使用它并行运行 df1["ColA"] = df.apply(lambda rows: func(rows[0], rows[1], row[2]), axis=1) df1["ColB"] = df.apply(lambda rows: func(rows[0], rows[3], row[4]), axis=1) df1["ColC"] = df.apply(lambda rows: func(rows[0], rows[5], row[6]), axis=1) 这是代码

我有一个代码，我想使用它并行运行

df1["ColA"] = df.apply(lambda rows: func(rows[0], rows[1], row[2]), axis=1)
df1["ColB"] = df.apply(lambda rows: func(rows[0], rows[3], row[4]), axis=1)
df1["ColC"] = df.apply(lambda rows: func(rows[0], rows[5], row[6]), axis=1)

这是代码的一部分。数据帧df中有超过100k行，func的每个操作都需要大量时间，因此我想并行化该任务

现在，我正在开发jupyter笔记本（作为anaconda 2的一部分），我尝试的任何多线程代码都失败了。作为示例，我尝试使用和以及其他一些示例，但所有这些示例都在windows和linux上被卡住了

有人能帮忙吗

编辑：我在windows上收到的错误消息之一是

AttributeError:'模块没有属性'rand_string'

如果熊猫的知识是必要的，你可能想考虑添加一个标签。我会添加标签，但我不认为熊猫的知识是必要的，因为几乎没有什么改变熊猫的角度。也许有一个更好的解决方案比运行多处理模块。发布您的数据帧和具有所需结果的数据帧，并可能找到矢量化的实现。@TEDPROU就数据帧而言，就是这样。我使用read_table命令从文件中加载数据，运行上面的3行并返回数据帧df1。就这样。