按行搜索一个数组中另一个数组的元素-Python/NumPy_Python_Numpy

按行搜索一个数组中另一个数组的元素-Python/NumPy

python numpy

按行搜索一个数组中另一个数组的元素-Python/NumPy,python,numpy,Python,Numpy,例如，我有一个独特元素的矩阵 a=[ [1,2,3,4], [7,5,8,6] ] 和另一个唯一的矩阵，该矩阵充满了第一个矩阵中出现的元素 b=[ [4,1], [5,6] ] 我期待着结果 [ [3,0], [1,3] ]. 也就是说，我想找到b的每一行元素，它等于同一行中a的一些元素，返回a中这些元素的索引。我该怎么做？谢谢。如果您不介意使用循环，这里有一个使用np的快速解决方案。其中： import numpy as np a=[[

例如，我有一个独特元素的矩阵

a=[
    [1,2,3,4],
    [7,5,8,6]
]

和另一个唯一的矩阵，该矩阵充满了第一个矩阵中出现的元素

b=[
    [4,1],
    [5,6]
]

我期待着结果

[
    [3,0],
    [1,3]
].

也就是说，我想找到b的每一行元素，它等于同一行中a的一些元素，返回a中这些元素的索引。

我该怎么做？谢谢。

如果您不介意使用循环，这里有一个使用np的快速解决方案。其中：

import numpy as np

a=[[1,2,3,4],
   [7,5,8,6]]
b=[[4,1],
   [5,6]]

a = np.array(a)
b = np.array(b)
c = np.zeros_like(b)

for i in range(c.shape[0]):
    for j in range(c.shape[1]):
        _, pos = np.where(a==b[i,j])
        c[i,j] = pos

print(c.tolist())

您可以这样做：

np.split(pd.DataFrame(a).where(pd.DataFrame(np.isin(a,b))).T.sort_values(by=[0,1])[::-1].unstack().dropna().reset_index().iloc[:,1].to_numpy(),len(a))                               

# [array([3, 0]), array([1, 3])]

这是一种矢量化方法-

# https://stackoverflow.com/a/40588862/ @Divakar
def searchsorted2d(a,b):
    m,n = a.shape
    max_num = np.maximum(a.max() - a.min(), b.max() - b.min()) + 1
    r = max_num*np.arange(a.shape[0])[:,None]
    p = np.searchsorted( (a+r).ravel(), (b+r).ravel() ).reshape(m,-1)
    return p - n*(np.arange(m)[:,None])

def search_indices(a, b):
    sidx = a.argsort(1)
    a_s = np.take_along_axis(a,sidx,axis=1)
    return np.take_along_axis(sidx,searchsorted2d(a_s,b),axis=1)

样本运行-

In [54]: a
Out[54]: 
array([[1, 2, 3, 4],
       [7, 5, 8, 6]])

In [55]: b
Out[55]: 
array([[4, 1],
       [5, 6]])

In [56]: search_indices(a, b)
Out[56]: 
array([[3, 0],
       [1, 3]])

另一个矢量化的-

你只需要独立地考虑每一行，它没有明确的排序，我已经改变了例子。<代码> A/<代码>中的条目保证是唯一的吗？欢迎来到！你的问题似乎没有任何逻辑？您能解释一下您需要对其执行哪些操作/流程吗？a和b中的每一行是否都有独特的元素？谢谢。但当我处理海量数据时，速度会慢得多。我想用矩阵的方式来解决这个问题，只是因为需要更快的处理速度。@Navaro通常的NumPy方式（在引擎罩下，即执行的方式）是用C实现的。所以，是的，看到这些在原生NumPy中实现会很好。目前，我只是在现有工具的基础上进行构建。

In [65]: (a[:,None,:]==b[:,:,None]).argmax(2)
Out[65]: 
array([[3, 0],
       [1, 3]])