Pandas 对多个XYZ文件执行自动空间连接

Pandas 对多个XYZ文件执行自动空间连接,pandas,dataframe,geopandas,Pandas,Dataframe,Geopandas,给定: 一组*.xyz数据(1m分辨率),总大小为5GB 目标: 识别位于目标点位置周围5m范围内的*.xyz信息 问题: 考虑到geopandas,我使用了一个空间连接-下面的代码正在运行,但它需要很多时间(2小时),尽管我已经跳过了每一行。我想知道是否有加速过程的选项,尽管将所有东西都集成到函数或循环中以减少代码总量,但我还是停留在这里。期待您的提示和建议 当前代码 #逐个文件调用xyz数据文件 #将数据帧转换为地理数据帧 df_Scatter01 = pd.DataFrame(Scatte

给定:

一组*.xyz数据(1m分辨率),总大小为5GB

目标:

识别位于目标点位置周围5m范围内的*.xyz信息

问题:

考虑到geopandas,我使用了一个空间连接-下面的代码正在运行,但它需要很多时间(2小时),尽管我已经跳过了每一行。我想知道是否有加速过程的选项,尽管将所有东西都集成到函数或循环中以减少代码总量,但我还是停留在这里。期待您的提示和建议

当前代码

#逐个文件调用xyz数据文件

#将数据帧转换为地理数据帧

df_Scatter01 = pd.DataFrame(Scatter01)
df_Scatter02 = pd.DataFrame(Scatter02)
[...]
#考虑缓冲形状文件的空间连接

Scatter01=gpd.sjoin(gdf01,buffer_target[['geometry']],op='within')
Scatter02=gpd.sjoin(gdf02,buffer_target[['geometry']],op='within')
[...]
#将geodataframe转换回dataframe

df_Scatter01 = pd.DataFrame(Scatter01)
df_Scatter02 = pd.DataFrame(Scatter02)
[...]
#合并最终数据帧

Scatter_final=pd.concat([df_Scatter01,df_Scatter02,[...]],ignore_index=True)

你能以书面形式提供样本数据吗?否则,潜在的助手将无法测试。
Scatter_final=pd.concat([df_Scatter01,df_Scatter02,[...]],ignore_index=True)