Python 用未知维数的cython写numpy码

Python 用未知维数的cython写numpy码,python,numpy,cython,Python,Numpy,Cython,假设我有一个Cython代码,其中的函数计算滚动移动平均值,并返回与输入大小相同的数组(该函数为初始部分添加nan,但这对于手头的问题并不重要) 我已经编写了三个Cython函数(如下所示): (a) sma_-vec处理numpy一维数组 (b) SMAU mat处理numpy二维数组 (c) 第三个sma根据大小从sma_-vec或sma_-mat返回值。(我的动机是最终将sma_-vec或sma_-mat之前的cpdef替换为cdef,以便Python代码只看到sma函数) 函数1-句柄n

假设我有一个Cython代码,其中的函数计算滚动移动平均值,并返回与输入大小相同的数组(该函数为初始部分添加
nan
,但这对于手头的问题并不重要)

我已经编写了三个Cython函数(如下所示):

(a)
sma_-vec
处理
numpy
一维数组

(b)
SMAU mat
处理
numpy
二维数组

(c) 第三个
sma
根据大小从
sma_-vec
sma_-mat
返回值。(我的动机是最终将
sma_-vec
sma_-mat
之前的
cpdef
替换为
cdef
,以便Python代码只看到
sma
函数)

函数1-句柄
numpy
一维数组

cimport cython
import numpy as np
cimport numpy as np
from numpy cimport ndarray as ar
ctypedef double dtype_t

@cython.boundscheck(False)
@cython.wraparound(False)
cpdef sma_vec(ar[dtype_t, ndim=1] x, int m):
    cdef int n
    cdef Py_ssize_t i, j
    cdef ar[dtype_t, ndim=1] y
    if m == 1:
        return x.copy()
    else:
        y = np.zeros_like(x) * np.nan
        n = x.shape[0]
        if n < m:
            return y
        else:
            for i in range(m-1, n):
                for j in range(i-m+1, i+1):
                    if j == i-m+1:
                        y[i] = x[j]
                    else:
                        y[i] += x[j]
                y[i] /= float(m)
            return y
@cython.boundscheck(False)
@cython.wraparound(False)
cpdef sma(ar[dtype_t] x, int m):
    if x.ndim == 1:
        return sma_vec(x, m)
    elif x.ndim == 2:
        return sma_mat(x, m)
    else:
        raise ValueError('Cannot handle more than two dimensions')
函数3-根据维度调用函数1或函数2

cimport cython
import numpy as np
cimport numpy as np
from numpy cimport ndarray as ar
ctypedef double dtype_t

@cython.boundscheck(False)
@cython.wraparound(False)
cpdef sma_vec(ar[dtype_t, ndim=1] x, int m):
    cdef int n
    cdef Py_ssize_t i, j
    cdef ar[dtype_t, ndim=1] y
    if m == 1:
        return x.copy()
    else:
        y = np.zeros_like(x) * np.nan
        n = x.shape[0]
        if n < m:
            return y
        else:
            for i in range(m-1, n):
                for j in range(i-m+1, i+1):
                    if j == i-m+1:
                        y[i] = x[j]
                    else:
                        y[i] += x[j]
                y[i] /= float(m)
            return y
@cython.boundscheck(False)
@cython.wraparound(False)
cpdef sma(ar[dtype_t] x, int m):
    if x.ndim == 1:
        return sma_vec(x, m)
    elif x.ndim == 2:
        return sma_mat(x, m)
    else:
        raise ValueError('Cannot handle more than two dimensions')
测试代码

import numpy as np
import common.movavg as mv

x1 = np.array([1.0, 1.4, 1.3, 5.3, 2.3])
y1 = mv.sma_vec(x1, 3)
y1a = mv.sma(x1, 3)
y1
y1a
都正确返回
数组([nan,nan,1.233333,2.666667,2.966667])

x2 = np.array([[1.0, 1.4, 1.3, 5.3, 2.3], [4.2, 1.3, 2.3, 5.7, -1.3]])
y2 = mv.sma_mat(x2, 2)
array([[  nan,  1.2 ,  1.35,  3.3 ,  3.8 ],
       [  nan,  2.75,  1.8 ,  4.  ,  2.2 ]])
y2
返回正确

x2 = np.array([[1.0, 1.4, 1.3, 5.3, 2.3], [4.2, 1.3, 2.3, 5.7, -1.3]])
y2 = mv.sma_mat(x2, 2)
array([[  nan,  1.2 ,  1.35,  3.3 ,  3.8 ],
       [  nan,  2.75,  1.8 ,  4.  ,  2.2 ]])
但当我尝试时:

y2a = mv.sma(x2, 2)
我得到一个错误:

Traceback (most recent call last):
  File "C:\PF\WinPython-64bit-3.4.2.4\python-3.4.2.amd64\lib\site-packages\IPython\core\interactiveshell.py", line 2883, in run_code
exec(code_obj, self.user_global_ns, self.user_ns)
  File "<ipython-input-4-dc092e343714>", line 3, in <module>
    y2a = mv.sma(x2, 2)
  File "movavg.pyx", line 54, in movavg.sma (stat\movavg.c:2206)
ValueError: Buffer has wrong number of dimensions (expected 1, got 2)
回溯(最近一次呼叫最后一次):
文件“C:\PF\WinPython-64bit-3.4.2.4\python-3.4.2.amd64\lib\site packages\IPython\core\interactiveshell.py”,第2883行,运行代码
exec(代码对象、self.user\u全局、self.user\n)
文件“”,第3行,在
y2a=中压sma(x2,2)
文件“movavg.pyx”,第54行,在movavg.sma中(stat\movavg.c:2206)
ValueError:缓冲区的维度数错误(预期为1,实际为2)
sma
函数中,问题似乎是
ar[dtype_t]x
(即
np.ndarray[double]x
)自动假定
x.ndim
的维度应为
1

如何重新编写
sma
函数,使其能够接受维度未知的
np.ndarray

从该链接:,“..”ndim“仅关键字参数,如果未提供,则假定为一维…”

解决方案是将函数3转换为:

@cython.boundscheck(False)
@cython.wraparound(False)
cpdef sma(ar x, int m):
    if x.ndim == 1:
        return sma_vec(x, m)
    elif x.ndim == 2:
        return sma_mat(x, m)
    else:
        raise ValueError('Cannot handle more than two dimensions')

我们需要完全删除
[]
中的所有内容。

看起来像是复制粘贴错误:您在检查
x.ndim==2
后调用向量:
elif x.ndim==2:返回SMAU vec(x,m)
。将其更改为
返回SMAU mat(x,m)
,您就可以出发了。谢谢您指出这一点。我更改了它,但代码意外地给出了相同的错误,只是为了检查,但是您在进行更改后重新编译了它?是的,我做了。实际上有几次。它在你的机器上运行了吗?