Deep learning 已知3D CAD对象的6D姿势估计,新对象的有限模型训练

Deep learning 已知3D CAD对象的6D姿势估计,新对象的有限模型训练,deep-learning,computer-vision,real-time,object-detection,cad,Deep Learning,Computer Vision,Real Time,Object Detection,Cad,我正在进行一个项目,需要在单个RGB图像中估计已知3D CAD对象的6自由度姿势-即,此任务:。这个问题有几个限制条件: 可用于商业用途(根据BSD、MIT、BOOST等授权),而非GPL CAD对象是已知的,我们的目标不是通用性(即识别所有椅子的类别) CAD对象可以由用户上传,因此它可能具有对称性和一系列纹理 推理步骤将在智能手机上运行,并且应该能够以>30fps的速度运行 推理步骤可以是a)查找对象的姿势一次,然后我可以编写代码继续跟踪它,或者b)连续查找对象的姿势。即,在找到初始姿势估

我正在进行一个项目,需要在单个RGB图像中估计已知3D CAD对象的6自由度姿势-即,此任务:。这个问题有几个限制条件:

  • 可用于商业用途(根据BSD、MIT、BOOST等授权),而非GPL
  • CAD对象是已知的,我们的目标不是通用性(即识别所有椅子的类别)
  • CAD对象可以由用户上传,因此它可能具有对称性和一系列纹理
  • 推理步骤将在智能手机上运行,并且应该能够以>30fps的速度运行
  • 推理步骤可以是a)查找对象的姿势一次,然后我可以编写代码继续跟踪它,或者b)连续查找对象的姿势。即,在找到初始姿势估计后,模型不需要任何连续的细化步骤
  • 可以是单个对象的单个实例到多个对象的多个实例(MiMo)范围内的任意位置。MiMO是首选,但不是必需的
  • 如果使用深度学习方法,则新CAD对象所需的培训时间应为小时,而不是天
  • 可以1)只找到对象的初始姿势,之后不进行任何细化步骤,或者2)找到对象的初始姿势,之后也进行细化步骤
我对传统方法持开放态度(即2D->3D对应,然后用PnP求解),但深度学习方法似乎优于传统方法(经典方法太慢)。纵观深度学习方法(poseCNN、HybridPose、Pix2Pose、CosyPose),除了需要模型训练时间外,大多数方法似乎都符合这些约束条件。虽然也许我可以使用一个预先训练好的模型,然后用更短的训练步骤为每个新的CAD对象专门化它。但我不确定这一点,我认为成功可能取决于所选择的具体模式。例如,此项目表示需要3小时的培训时间:

所以,我的问题是:有人知道,对于一个新的CAD对象来说,最先进的、商业上可用的、不需要大量培训时间的实现是什么吗