Computer vision 需要帮助理解三个观点吗_Computer Vision_Linear Algebra_3d Reconstruction

Computer vision 需要帮助理解三个观点吗

computer-vision

Computer vision 需要帮助理解三个观点吗,computer-vision,linear-algebra,3d-reconstruction,Computer Vision,Linear Algebra,3d Reconstruction,我正在听关于P3P问题的解释，有几个问题在标有第1节的标题中，它们将图像平面点投影到单位球体上。我不知道他们为什么这么做，这是为了模拟照相机镜头吗？我知道，在中，我们首先计算相机的本质并将其分解为solvePnP。这个单位球有类似的用途吗同样在第1节中，$u^{'}uX$、$u^{'}uY$和$u^{'}uZ$是从哪里来的，它们是什么？如果我们投影到二维平面上，那么为什么我们需要第三个组件？我知道标准答案是“因为同质坐标”，但我似乎找不到一个解释来解释我们为什么使用它们或者它们到底是什么同

我正在听关于P3P问题的解释，有几个问题

在标有第1节的标题中，它们将图像平面点投影到单位球体上。我不知道他们为什么这么做，这是为了模拟照相机镜头吗？我知道，在中，我们首先计算相机的本质并将其分解为
solvePnP
。这个单位球有类似的用途吗

同样在第1节中，$u^{'}uX$、$u^{'}uY$和$u^{'}uZ$是从哪里来的，它们是什么？如果我们投影到二维平面上，那么为什么我们需要第三个组件？我知道标准答案是“因为同质坐标”，但我似乎找不到一个解释来解释我们为什么使用它们或者它们到底是什么

同样在第1节中，“使用二语规范化”是什么意思，这一步完成了什么
我希望如果我理解了第1节，我就能理解下面几节中的符号
谢谢
这里有一些提示

单位球体上的投影与相机镜头无关。这只是一个数学变换，旨在简化P3P方程组（我们正试图计算其解）

$u''ux$和$u''uy$是$（u，v）-p$（此处$p=（c_x，c_y）$）的坐标，由焦距$f_x$和$f_y$标准化。相机光学中心$P$的减法是原点到此点的平移。引入$z$坐标$u''uz=1$将二维点$（u''ux，u''uy）$移动到由等式$z=1$定义的三维平面（平行于$xy$平面的三维平面）。请注意，通过将点移动到平面$z=1$，现在可以更好地将它们可视化为通过$P$的三维线与它们的交点。换句话说，这些点成为位于这些线某处的3D点在2D平面上的投影（不仅仅是“某处”，而是在焦距处，在除以$f_x$和$f_y$后，焦距现在已“标准化”为1）。同样，所有旨在求解方程的变换

所谓的$L2$范数只不过是来自Pithagoras定理的通常距离（$a^2+b^2=c^2$），只是用来测量3D空间中点之间的距离

谢谢你的详细回复。以下几点：投影到单位球体上如何简化系统？是什么让人凭直觉这么做的？好问题。为了理解这一点，我还没有深入研究这个方程。我只是想给你一些线索，帮助你前进，因为我钦佩你的勇气。我能说的是，当你必须处理3D角度时，投影到单位球体上是一种众所周知的技术，因为它们可以用球体上的点来表征。此外，将2D对象移动到平面$z=1$的技术在射影几何中是众所周知的，射影几何通过使方程均匀化简化了方程。如果你想知道更多，我建议你多了解这些话题。太好了，谢谢！我已经开始阅读H&Z，它有一个关于射影几何的章节，贴着：。请每个社区都应该诚实地回答问题，而不浪费任何人的时间。