Python 熊猫数据帧并行应用(更快,TQDM::进程映射)冻结?被叫的时候

Python 熊猫数据帧并行应用(更快,TQDM::进程映射)冻结?被叫的时候,python,pandas,tqdm,swifter,Python,Pandas,Tqdm,Swifter,我有一个数据帧,有大约15k条路径到音频文件,我想在其上执行操作(人为添加噪声)。一般来说,整个过程都是有效的,但即使记录较少,也需要很长时间。问题不在于函数的执行时间,而在于函数初始化之前的时间 start=time.time() data\u augmented=data\u augmented.swifter.progress\u条(True,desc=“合并声音”)\ .apply(合并声音(**设置),轴=1) 打印(f“{time.time-(start)}-Map Timer”)

我有一个数据帧,有大约15k条路径到音频文件,我想在其上执行操作(人为添加噪声)。一般来说,整个过程都是有效的,但即使记录较少,也需要很长时间。问题不在于函数的执行时间,而在于函数初始化之前的时间

start=time.time()
data\u augmented=data\u augmented.swifter.progress\u条(True,desc=“合并声音”)\
.apply(合并声音(**设置),轴=1)
打印(f“{time.time-(start)}-Map Timer”)
卡在:

Merge_sounds [16 Threads]:   0%|                         | 0/16 [00:00<?, ?it/s]
Merge Sounds: 16 Threads:  38%|██████          | 6/16 [00:00<00:00, 4697.75it/s]
卡在:

Merge_sounds [16 Threads]:   0%|                         | 0/16 [00:00<?, ?it/s]
Merge Sounds: 16 Threads:  38%|██████          | 6/16 [00:00<00:00, 4697.75it/s]
我是否放弃了并行化Map函数的方法(在我的代码中,似乎在其他地方都可以使用这种变体)


如果通过绕过TQDM解决了此问题,则为高级。

。我把柱子拉上了拉链我需要这样的东西

\u路径输入=\u df[“路径输入”]
_路径输出=_df[“路径输出”]
_路径噪声=_df[“路径噪声”]
job=zip(路径输入、路径噪声、路径输出、过滤作业)
然后我把它传递给多处理器函数

jobs=list(枚举((zip_作业(df)))
将池(进程=_线程)作为池:
data_augmented=pool.map(执行_作业,tqdm(作业,desc=f“音频增强:{u线程}线程”))
merge\u声音
和新的
execute\u作业
相似,只是改变了,函数需要什么参数