Python 为什么使用内置字符串库连接pandas系列字符串比使用pandas cat方法更快?

Python 为什么使用内置字符串库连接pandas系列字符串比使用pandas cat方法更快?,python,pandas,string,performance,Python,Pandas,String,Performance,我需要为SQL查询连接数千个字符串,因此我的第一反应是在将序列转换为列表后使用本机pythonstr.join()方法。然而,在这样做之后,我意识到在熊猫体内有一种类似于本地的方法来实现这一点,我发现df.str.cat() 运行一个快速的timeit我发现str.join()做这项工作几乎快了四倍。谁能解释相对较大的时间差异 这里有一个可复制的例子 val_list = pd.Series(pd._testing.rands_array(150, 1392)) %timeit str.joi

我需要为SQL查询连接数千个字符串,因此我的第一反应是在将序列转换为列表后使用本机python
str.join()
方法。然而,在这样做之后,我意识到在熊猫体内有一种类似于本地的方法来实现这一点,我发现
df.str.cat()

运行一个快速的
timeit
我发现
str.join()
做这项工作几乎快了四倍。谁能解释相对较大的时间差异

这里有一个可复制的例子

val_list = pd.Series(pd._testing.rands_array(150, 1392))
%timeit str.join(",", val_list.tolist())
%timeit val_list.str.cat(sep=',')
vs。Python字符串库是用cpython编写的,pandas正在处理成为pandas的开销。vs。Python字符串库是用cpython编写的,pandas正在处理成为pandas的开销。