Deep learning 已知3D CAD对象的6D姿势估计，新对象的有限模型训练_Deep Learning_Computer Vision_Real Time_Object Detection_Cad

Deep learning 已知3D CAD对象的6D姿势估计，新对象的有限模型训练

deep-learning computer-vision

Deep learning 已知3D CAD对象的6D姿势估计，新对象的有限模型训练,deep-learning,computer-vision,real-time,object-detection,cad,Deep Learning,Computer Vision,Real Time,Object Detection,Cad,我正在进行一个项目，需要在单个RGB图像中估计已知3D CAD对象的6自由度姿势-即，此任务：。这个问题有几个限制条件：可用于商业用途（根据BSD、MIT、BOOST等授权），而非GPL CAD对象是已知的，我们的目标不是通用性（即识别所有椅子的类别） CAD对象可以由用户上传，因此它可能具有对称性和一系列纹理推理步骤将在智能手机上运行，并且应该能够以>30fps的速度运行推理步骤可以是a）查找对象的姿势一次，然后我可以编写代码继续跟踪它，或者b）连续查找对象的姿势。即，在找到初始姿势估

我正在进行一个项目，需要在单个RGB图像中估计已知3D CAD对象的6自由度姿势-即，此任务：。这个问题有几个限制条件：

可用于商业用途（根据BSD、MIT、BOOST等授权），而非GPL
CAD对象是已知的，我们的目标不是通用性（即识别所有椅子的类别）
CAD对象可以由用户上传，因此它可能具有对称性和一系列纹理
推理步骤将在智能手机上运行，并且应该能够以>30fps的速度运行
推理步骤可以是a）查找对象的姿势一次，然后我可以编写代码继续跟踪它，或者b）连续查找对象的姿势。即，在找到初始姿势估计后，模型不需要任何连续的细化步骤
可以是单个对象的单个实例到多个对象的多个实例（MiMo）范围内的任意位置。MiMO是首选，但不是必需的
如果使用深度学习方法，则新CAD对象所需的培训时间应为小时，而不是天
可以1）只找到对象的初始姿势，之后不进行任何细化步骤，或者2）找到对象的初始姿势，之后也进行细化步骤

我对传统方法持开放态度（即2D->3D对应，然后用PnP求解），但深度学习方法似乎优于传统方法（经典方法太慢）。纵观深度学习方法（poseCNN、HybridPose、Pix2Pose、CosyPose），除了需要模型训练时间外，大多数方法似乎都符合这些约束条件。虽然也许我可以使用一个预先训练好的模型，然后用更短的训练步骤为每个新的CAD对象专门化它。但我不确定这一点，我认为成功可能取决于所选择的具体模式。例如，此项目表示需要3小时的培训时间：

所以，我的问题是：有人知道，对于一个新的CAD对象来说，最先进的、商业上可用的、不需要大量培训时间的实现是什么吗