Pandas 对多个XYZ文件执行自动空间连接_Pandas_Dataframe_Geopandas

Pandas 对多个XYZ文件执行自动空间连接

pandas dataframe

Pandas 对多个XYZ文件执行自动空间连接,pandas,dataframe,geopandas,Pandas,Dataframe,Geopandas,给定：一组*.xyz数据（1m分辨率），总大小为5GB 目标：识别位于目标点位置周围5m范围内的*.xyz信息问题：考虑到geopandas，我使用了一个空间连接-下面的代码正在运行，但它需要很多时间（2小时），尽管我已经跳过了每一行。我想知道是否有加速过程的选项，尽管将所有东西都集成到函数或循环中以减少代码总量，但我还是停留在这里。期待您的提示和建议当前代码 #逐个文件调用xyz数据文件 #将数据帧转换为地理数据帧 df_Scatter01 = pd.DataFrame(Scatte

给定：

一组*.xyz数据（1m分辨率），总大小为5GB

目标：

识别位于目标点位置周围5m范围内的*.xyz信息

问题：

考虑到geopandas，我使用了一个空间连接-下面的代码正在运行，但它需要很多时间（2小时），尽管我已经跳过了每一行。我想知道是否有加速过程的选项，尽管将所有东西都集成到函数或循环中以减少代码总量，但我还是停留在这里。期待您的提示和建议

当前代码

#逐个文件调用xyz数据文件

#将数据帧转换为地理数据帧

df_Scatter01 = pd.DataFrame(Scatter01)
df_Scatter02 = pd.DataFrame(Scatter02)
[...]

#考虑缓冲形状文件的空间连接

Scatter01=gpd.sjoin(gdf01,buffer_target[['geometry']],op='within')
Scatter02=gpd.sjoin(gdf02,buffer_target[['geometry']],op='within')
[...]

#将geodataframe转换回dataframe

df_Scatter01 = pd.DataFrame(Scatter01)
df_Scatter02 = pd.DataFrame(Scatter02)
[...]

#合并最终数据帧

Scatter_final=pd.concat([df_Scatter01,df_Scatter02,[...]],ignore_index=True)

你能以书面形式提供样本数据吗？否则，潜在的助手将无法测试。

Scatter_final=pd.concat([df_Scatter01,df_Scatter02,[...]],ignore_index=True)