什么算法对实时检测视频帧中的可变形ROI(而非对象)最有用? 我在Matlab中进行一个项目(以后用C++或Python实现,用OpenCV),当一个实时视频启动时,用户可以画出感兴趣的区域。它将被绘制成多边形。但是,该ROI可能会离开帧,然后重新出现。在这一点上,它应该被识别和检测。主要问题是,它不是一个具有特殊物理特性的显著对象,因为它可以(在某种程度上)改变形状、弯曲和拉伸。而且,它应该是实时运行的,这使得培训难以实施

什么算法对实时检测视频帧中的可变形ROI(而非对象)最有用? 我在Matlab中进行一个项目(以后用C++或Python实现,用OpenCV),当一个实时视频启动时,用户可以画出感兴趣的区域。它将被绘制成多边形。但是,该ROI可能会离开帧,然后重新出现。在这一点上,它应该被识别和检测。主要问题是,它不是一个具有特殊物理特性的显著对象,因为它可以(在某种程度上)改变形状、弯曲和拉伸。而且,它应该是实时运行的,这使得培训难以实施,python,algorithm,matlab,image-recognition,roi,Python,Algorithm,Matlab,Image Recognition,Roi,我尝试使用颜色直方图来强调ROI的颜色特征,然后对图像设置阈值,但它只在特定条件下有效。我有工程背景,但在此之前没有使用过任何机器学习。我读到,支持向量机的HOG特征可能会有所帮助,甚至是Hough变换。我使用ACF获得了一些很好的结果,但它仍然需要分类器的训练阶段 这样做的目的是在跟踪器完全丢失后重新初始化该区域内的跟踪器。我知道,训练分类器后,可以通过多种算法识别它,但我的问题是实时识别,而无需事先进行任何训练 由于视频是外科手术,我上传了4个示例帧,说明用户ROI的边界框是什么 (下面是手

我尝试使用颜色直方图来强调ROI的颜色特征,然后对图像设置阈值,但它只在特定条件下有效。我有工程背景,但在此之前没有使用过任何机器学习。我读到,支持向量机的HOG特征可能会有所帮助,甚至是Hough变换。我使用ACF获得了一些很好的结果,但它仍然需要分类器的训练阶段

这样做的目的是在跟踪器完全丢失后重新初始化该区域内的跟踪器。我知道,训练分类器后,可以通过多种算法识别它,但我的问题是实时识别,而无需事先进行任何训练

由于视频是外科手术,我上传了4个示例帧,说明用户ROI的边界框是什么

(下面是手术的清晰照片,用鼠标悬停在该区域上方或单击以显示它们)。


任何建议都会有很大帮助。

因为ROI是实时确定的,所以我认为带预培训的功能在这里不起作用。最近,我抓住了一个有助于解决问题的话题。建议的解决方案是

步骤是捕获ROI并使用模板匹配在每一帧中搜索“最佳相似”区域

因为在您的情况下,对象可能会随着时间的推移而发生变化(不会太多),结果可能并不完美,但这是一种很好的方法

上述主题的图片


我知道有人用CNN来做这件事,但是实时运行会产生额外的问题,特别是在没有深入的CS/AI知识的情况下。但是,使用OpenCV中的模板匹配可以得到一些有用的结果。不理想,但不止是一个好的起点。谢谢