Python 为什么透视相机会翻转轴？_Python_Numpy_Opencv_Computer Vision

Python 为什么透视相机会翻转轴？

python numpy opencv computer-vision

Python 为什么透视相机会翻转轴？,python,numpy,opencv,computer-vision,Python,Numpy,Opencv,Computer Vision,我试图用Python实现一个简单的透视相机，它有一个右手坐标系，+x轴是右边的，+y轴是向上的，+z轴不在屏幕上我有一些代码可以将点从3D世界坐标投影到2D图像坐标。为了测试它，我尝试沿+X、+Y和+Z轴投影三个单位向量并渲染它们，但当我这样做时，所有的点都显示为“在摄影机后面”，正如我期望看到的那样：当我取消注释线l=-l时，所有显示的轴都会翻转，当我围绕指向的原点旋转相机时，它们看不到在正确的平面上旋转这是我显示问题的代码。有什么我不明白的吗 import numpy as np

我试图用Python实现一个简单的透视相机，它有一个右手坐标系，+x轴是右边的，+y轴是向上的，+z轴不在屏幕上

我有一些代码可以将点从3D世界坐标投影到2D图像坐标。为了测试它，我尝试沿+X、+Y和+Z轴投影三个单位向量并渲染它们，但当我这样做时，所有的点都显示为“在摄影机后面”，正如我期望看到的那样：

当我取消注释线

l=-l

时，所有显示的轴都会翻转，当我围绕指向的原点旋转相机时，它们看不到在正确的平面上旋转

这是我显示问题的代码。有什么我不明白的吗

import numpy as np
import cv2

def compute_focal(angle, dimension):
    return dimension / 2.0 / np.tan( np.radians(angle) / .2)

# Positive camera at c looking at p with up=u http://ksimek.github.io/2012/08/22/extrinsic/
def lookat(c, p, u):
    l = p - c
    l = l / np.linalg.norm(l)
    s = np.cross(l, u)
    s = s / np.linalg.norm(s)
    u = np.cross(s, l)

    # uncomment this and the axis will appear by are all flipped
    # l = -l

    R = np.vstack( (s, u, -l))
    Rc = R.T
    return Rc

# project 3D point into camera define by projection matrix
def projectPoint(P, point):
    xw, yw, zw = point
    W = np.array([ [xw, yw, zw, 1] ]).T
    xi, yi, zi = P.dot(W).flatten()

    if zi < 0.0:
        print("point {},{},{} is behind the camera!".format(xi, yi, zi))

    xi = int(xi + 0.5)
    yi = int(yi + 0.5)
    return xi, yi

theta = 0

while True:
    # used to rotate the camera around the y-axis looking at origin
    theta += 1

    w  = h  = 500
    fx = fy = compute_focal(w, 45.)
    cx = w / 2.
    cy = h / 2.

    K = np.array([ [fx, 0., cx], [0., fy, cy], [0., 0., 1.] ], dtype='float32')

    # position of the camera in world coordintes 1-unit from the origin rotating around the y-axis looking at the origin
    C = np.array([ np.sin(np.radians(theta)), 0, np.cos(np.radians(theta)) ])
    # pointing towards the origin
    P = np.array([ 0.0, 0.0, 0.0 ])
    # up direction is along the positive y-axis
    U = np.array([ 0, 1, 0 ])
    Rc = lookat(C, P, U)

    img = np.zeros((h, w, 3), dtype='uint8')

    # create the projection matrix from camera position
    R = Rc.T
    t = R.dot( -np.reshape(C, (3, 1)) )
    P = K.dot(np.hstack([R, t]))

    # draw and project positive principle axes
    x0, y0 = projectPoint(P, (0, 0, 0))
    x1, y1 = projectPoint(P, (1, 0, 0))
    x2, y2 = projectPoint(P, (0, 1, 0))
    x3, y3 = projectPoint(P, (0, 0, 1))

    # x-axis red
    cv2.line(img, (x0, y0), (x1, y1), [0, 0, 255], 1)
    # y-axis green
    cv2.line(img, (x0, y0), (x2, y2), [0, 255, 0], 1)
    # z-axis blue
    cv2.line(img, (x0, y0), (x3, y3), [255, 0, 0], 1)

    # flip image because opencv images have origin in top left
    img = np.flipud(img)

    cv2.imshow("camera", img)
    cv2.waitKey(1)

将numpy导入为np
进口cv2
def计算焦距（角度、尺寸）：
返回尺寸/2.0/np.tan（np.弧度（角度）/.2）
#正相机在c处，向上看p=uhttp://ksimek.github.io/2012/08/22/extrinsic/
def注视（c、p、u）：
l=p-c
l=l/np.线性范数（l）
s=np.交叉（l，u）
s=s/np.linalg.norm（s）
u=横截面（s，l）
#取消对此的注释，轴将显示为全部翻转
#l=-l
R=np.vstack（（s，u，-l））
Rc=R.T
返回Rc
#将三维点投影到由投影矩阵定义的摄影机中
def项目点（P，点）：
xw，yw，zw=点
W=np.array（[[xw，yw，zw，1]]）.T
席，易，Z= P.DOT（W）.平坦（）
如果zi<0.0：
打印（“点{}，{}，{}在相机后面！”。格式（xi，yi，zi））
席= int（席+ 0.5）
yi=int（yi+0.5）
归席
θ=0
尽管如此：
#用于围绕y轴旋转摄影机，查看原点
θ+=1
w=h=500
fx=fy=compute_focal（w，45.）
cx=w/2。
cy=h/2。
K=np.array（[[fx，0,cx]，[0,fy，cy]，[0,0,1.]]，dtype='float32'）
#摄像机在世界坐标系中的位置，距离原点1个单位，绕y轴旋转，观察原点
C=np.数组（[np.sin（np.弧度（θ）），0，np.cos（np.弧度（θ）））
#指向原点
P=np.数组（[0.0,0.0,0.0]）
#向上方向沿正y轴
U=np.array（[0,1,0]）
Rc=注视（C，P，U）
img=np.zero（（h，w，3），dtype='uint8'）
#从摄影机位置创建投影矩阵
R=Rc.T
t=R.dot（-np.重塑（C，（3，1）））
P=K.dot（np.hstack（[R，t]））
#绘制并投影正主轴
x0，y0=投影点（P，（0，0，0））
x1，y1=投影点（P，（1，0，0））
x2，y2=投影点（P，（0，1，0））
x3，y3=投影点（P，（0,0,1））
#x轴红色
cv2.线（img，（x0，y0），（x1，y1），[0,0255]，1）
#y轴绿色
cv2.线（img，（x0，y0），（x2，y2），[0255，0]，1）
#z轴蓝色
cv2.线（img，（x0，y0），（x3，y3），[255，0，0]，1）
#翻转图像，因为opencv图像的原点位于左上角
img=np.flipud（img）
cv2.imshow（“摄像机”，img）
cv2.等待键（1）

如果我将intrinsics矩阵改为：

 K = np.array([
            [fx, 0., -cx],
            [0., fy, -cy],
            [0., 0., -1.]
        ], dtype='float32')

这些条目被否定。我不知道为什么，但我在一些示例代码中看到了它，并尝试了它，虽然它非常不直观，但它仍然有效

如果我将intrinsics矩阵改为：

 K = np.array([
            [fx, 0., -cx],
            [0., fy, -cy],
            [0., 0., -1.]
        ], dtype='float32')

这些条目被否定。我不知道为什么，但我在一些示例代码中看到了它，并尝试了它，虽然它非常不直观，但它仍然有效

是因为z轴不在屏幕上吗？因此，以openGL为例，假设相机在-z方向上观看，afaikBut不是右手坐标系？右手坐标系很好，但这意味着相机正在观看“后退”，因此可见对象在本地相机系统中具有负z坐标。但是：如果使用openCV函数进行三维重建（可能是投影）坐标系是不同的：x到右边，y到底部，z到深度。这是因为它们希望保持与图像相同的y方向（原点=左上，+y向下）请看一下opencv cam模型：这是因为z轴不在屏幕上吗？正因为如此，例如openGL假设相机朝-z方向看，afaikBut不是右手坐标系？右手坐标系很好，但这意味着相机正在观看“后退”，因此可见对象在局部相机系统中具有负z坐标。但是：如果您使用openCV函数进行三维重建（可能是投影），坐标系不同：x到右侧，y到底部，z到深度。这是因为它们希望与图像保持相同的y方向（原点=左上，+y向下）.请在此处查看opencv cam模型：