NumPy vectorize()或dot()出现错误

NumPy vectorize()或dot()出现错误,numpy,types,vectorization,Numpy,Types,Vectorization,在下面的代码中,y1和y2应该相等,但它们不是。矢量化()或点()中是否存在错误 y1和y2的图形:为了应用正确的强制转换规则,numpy偶尔使用您的函数和sentinel值(numpy.int64)来检查它输出的数据类型,如果它输出整数0,因为这是max返回的结果,那么它假设计算结果都应该是整数,并舍入其他结果,但是如果您通过在max中使用0.0将函数更改为始终返回浮点: def fun(x, pivot, truth): if truth: return max(0.0, x - p

在下面的代码中,y1和y2应该相等,但它们不是。矢量化()或点()中是否存在错误


y1和y2的图形:

为了应用正确的强制转换规则,numpy偶尔使用您的函数和sentinel值(numpy.int64)来检查它输出的数据类型,如果它输出整数
0
,因为这是
max
返回的结果,那么它假设计算结果都应该是整数,并舍入其他结果,但是如果您通过在max中使用
0.0
将函数更改为始终返回浮点:

def fun(x, pivot, truth):
    if truth: return max(0.0, x - pivot)
    else:     return max(0.0, pivot - x)

然后numpy应用的检查将始终导致浮点结果,并且不会应用舍入。

我不确定这是否适用于您的情况,但是
矢量化有一些技巧

如果未指定返回值
dtype
,它将通过测试计算确定返回值-第一个案例。如果函数返回标量整数,如0,则
vectorize
返回整数数组。因此,如果希望浮动,请确保指定返回
dtype

另外-
vectorize
不是一种速度工具。这只是一种将广播应用于输入的便捷方式。它并不比显式循环输入快多少

np.vectorize(fun, otypes=[float])
删除步骤

===========

试试这个:

vfun = np.vectorize(fun, otypes=[float])
X = vfun(interval[:,None], pivots, truths)
print(X.shape)     # (300,3)
y2 = np.dot(X, coeffs)
print(y2.shape)    # (300,)
它更充分地利用了
矢量化的
广播

我怀疑你的
fun
可以编写成对整个
x
起作用,而不需要
矢量化所做的迭代

fun
更改为使用
np.maximum
,允许我提供一个数组
x

def fun(x, pivot, truth):
    if truth: return np.maximum(0, x - pivot)
    else:     return np.maximum(0, pivot - x)
然后我可以计算
X
,只需在
枢轴
真理
的3种情况下循环,一次计算所有
间隔
值:

X = np.stack([fun(interval, p, t) for p, t in zip(pivots, truths)], axis=-1)
y2 = np.dot(X, coeffs)
应用3个“案例”的另一种方法

Xlist = [fun(interval, p, t)*c for p, t, c in zip(pivots, truths, coeffs)]
y2 = np.sum(Xlist, axis=0)
因为
np.dot(…,coefs)
只是一个加权和。我不确定它是否更好

Xlist = [fun(interval, p, t)*c for p, t, c in zip(pivots, truths, coeffs)]
y2 = np.sum(Xlist, axis=0)