Python 在多边形内生成坐标_Python_Numpy

Python 在多边形内生成坐标

python numpy

Python 在多边形内生成坐标,python,numpy,Python,Numpy,我想将多边形的值放入一个精细的规则网格中。例如，我有以下坐标： data = 2.353 data_lats = np.array([57.81000137, 58.15999985, 58.13000107, 57.77999878]) data_lons = np.array([148.67999268, 148.69999695, 148.47999573, 148.92999268]) 我的常规网格如下所示： delta = 0.25 grid_lons = np.ara

我想将多边形的值放入一个精细的规则网格中。例如，我有以下坐标：

data = 2.353
data_lats = np.array([57.81000137,  58.15999985,  58.13000107,  57.77999878])
data_lons = np.array([148.67999268,  148.69999695,  148.47999573,  148.92999268])

我的常规网格如下所示：

delta = 0.25
grid_lons = np.arange(-180, 180, delta)
grid_lats = np.arange(90, -90, -delta)
llx, lly = np.meshgrid( grid_lons, grid_lats )
rows = lly.shape[0]
cols = llx.shape[1]
grid = np.zeros((rows,cols))

row = np.floor( data_lats/delta ) + (llx.shape[0]/2)
col = np.floor( data_lons/delta ) + (llx.shape[1]/2)

现在我可以很容易地找到对应于多边形中心的栅格像素：

centerx, centery = np.mean(data_lons), np.mean(data_lats)
row = int(np.floor( centery/delta ) + (grid.shape[0]/2))
col = int(np.floor( centerx/delta ) + (grid.shape[1]/2))
grid[row,col] = data

但是，可能有两个栅格像素仍然与多边形相交。因此，我想在多边形内生成一组坐标（data_lons，data_lats），并像以前一样找到它们对应的网格像素。您是否建议随机或系统地生成坐标？我失败了，但仍在努力

注意：一个数据集包含大约80000个多边形，因此它必须非常快（几秒钟）。这也是我选择这种方法的原因，因为它没有考虑重叠区域。。。（就像我前面的问题，它非常慢）

您需要测试以下方法，看看它是否足够快。首先，您应该将所有LAT和LON修改为，使它们（可能是分数）索引进入网格：

idx_lats = (data_lats - lat_grid_start) / lat_grid step
idx_lons = (data_lons - lon_grid_start) / lon_grid step

接下来，我们要将多边形拆分为三角形。对于任何凸多边形，可以将多边形的中心作为所有三角形的一个顶点，然后将多边形的顶点连续成对。但是，如果多边形都是四边形，那么将它们分成两个三角形会更快，第一个顶点是0、1、2，第二个顶点是0、2、3

为了知道某个点是否在三角形内，我将使用所描述的重心坐标方法。第一个函数检查一组点是否在三角形内：

def check_in_triangle(x, y, x_tri, y_tri) :
    A = np.vstack((x_tri[0], y_tri[0]))
    lhs = np.vstack((x_tri[1:], y_tri[1:])) - A
    rhs = np.vstack((x, y)) - A
    uv = np.linalg.solve(lhs, rhs)
    # Equivalent to (uv[0] >= 0) & (uv[1] >= 0) & (uv[0] + uv[1] <= 1)
    return np.logical_and(uv >= 0, axis=0) & (np.sum(uv, axis=0) <= 1)

def lattice_points_in_triangle(x_tri, y_tri) :
    x_grid = np.arange(np.ceil(np.min(x_tri)), np.floor(np.max(x_tri)) + 1)
    y_grid = np.arange(np.ceil(np.min(y_tri)), np.floor(np.max(y_tri)) + 1)
    x, y = np.meshgrid(x_grid, y_grid)
    x, y = x.reshape(-1), y.reshape(-1)
    idx = check_in_triangle(x, y, x_tri, y_tri)
    return x[idx], y[idx]

对于四边形，只需调用最后一个函数两次：

def lattice_points_in_quadrilateral(x_quad, y_quad) :
    return map(np.concatenate,
               zip(lattice_points_in_triangle(x_quad[:3], y_quad[:3]),
                   lattice_points_in_triangle(x_quad[[0, 2, 3]],
                                              y_quad[[0, 2, 3]])))

如果对示例数据运行此代码，将返回两个空数组：这是因为四边形点的顺序令人惊讶：索引0和1定义一个对角线，2和3定义另一个对角线。我上面的函数期望顶点围绕多边形排序。如果你真的是这样做的，你需要改变第二次调用

lattice\u points\u in\u triangle

inside

lattice\u points\u in\u quadraming

，这样使用的索引是

[0,1,3]

而不是

[0,2,3]

现在，随着这一变化：

>>> idx_lats = (data_lats - (-180) ) / 0.25
>>> idx_lons = (data_lons - (-90) ) / 0.25
>>> lattice_points_in_quadrilateral(idx_lats, idx_lons)
[array([952]), array([955])]

如果将栅格的分辨率更改为0.1：

>>> idx_lats = (data_lats - (-180) ) / 0.1
>>> idx_lons = (data_lons - (-90) ) / 0.1
>>> lattice_points_in_quadrilateral(idx_lats, idx_lons)
[array([2381, 2380, 2381, 2379, 2380, 2381, 2378, 2379, 2378]),
 array([2385, 2386, 2386, 2387, 2387, 2387, 2388, 2388, 2389])]

就时间而言，在我的系统中，这种方法对于您的需求来说，速度要慢10倍左右：

In [8]: %timeit lattice_points_in_quadrilateral(idx_lats, idx_lons)
1000 loops, best of 3: 269 us per loop

你现在看到的是超过20秒。处理80000个多边形。

我通过简单地计算角点像素之间的坐标，找到了一个快速而肮脏的解决方案。看一看:

dlats = np.zeros((data_lats.shape[0],4))+np.nan
dlons = np.zeros((data_lons.shape[0],4))+np.nan
idx = [0,1,3,2,0] #rearrange the corner pixels

for cc in range(4):
    dlats[:,cc] = np.mean((data_lats[:,idx[cc]],data_lats[:,idx[cc+1]]), axis=0)
    dlons[:,cc] = np.mean((data_lons[:,idx[cc]],data_lons[:,idx[cc+1]]), axis=0)

data_lats = np.column_stack(( data_lats, dlats ))
data_lons = np.column_stack(( data_lons, dlons ))

因此，红点代表原始角点，蓝点代表它们之间的中间像素点

我可以再做一次，包括中心像素（geo[：，[4,9]]）

这非常好，我可以将每个点直接指定给对应的栅格像素，如下所示：

delta = 0.25
grid_lons = np.arange(-180, 180, delta)
grid_lats = np.arange(90, -90, -delta)
llx, lly = np.meshgrid( grid_lons, grid_lats )
rows = lly.shape[0]
cols = llx.shape[1]
grid = np.zeros((rows,cols))

row = np.floor( data_lats/delta ) + (llx.shape[0]/2)
col = np.floor( data_lons/delta ) + (llx.shape[1]/2)

然而，最后的装箱现在需要~7秒！！！如何加快此代码的速度：

for ii in np.arange(len(data)):
    for cc in np.arange(data_lats.shape[1]):
        final_grid[row[ii,cc],col[ii,cc]] += data[ii]
        final_grid_counts[row[ii,cc],col[ii,cc]] += 1

看看你的上一个问题，它有一个有用的图形来显示比例，似乎每个网格像素都应该与一个多边形关联，在这种情况下，你可以找到网格像素的中心，并将其与最近的多边形中心关联。这是一个很好的点。不幸的是，一些多边形共享网格像素的很大一部分，因此我取它们的平均值。上面我没有提到的是，我将所有的值相加到一个网格像素中，然后从总计数中取平均值。我想这更现实一点。只是忘了。。。通过为每个网格像素找到最近的多边形中心，计算应该会显著提高？所以我认为最好换一种方式。我不是专家，但我认为匹配距离比计算重叠要快得多。我在我的研究中也做了类似的事情，速度并不太慢，但我只有~1k的粒子。我肯定会更多地利用距离，也许我搞错了。不过，目前上述代码并未计算任何重叠。到目前为止只需要1秒，因为它只是赋值。此外，多边形看起来不像正方形，因此中心可能比其他边更靠近某些边。非常感谢您提供的详细答案！我绝对可以从中学习！不过，运行时间让我有点担心，因为在我的情况下，这种卫星像素的存储速度应该非常快。为了清洁，你应该接受自己的答案，并将其作为一个新问题发布。我还没有详细研究您的代码，但是for循环太多了，因为它不可能有很大的改进。