Image processing 使用人脸检测和其他功能自动裁剪缩略图的最新解决方案_Image Processing_Crop_Face Detection_Feature Detection

Image processing 使用人脸检测和其他功能自动裁剪缩略图的最新解决方案

image-processing

Image processing 使用人脸检测和其他功能自动裁剪缩略图的最新解决方案,image-processing,crop,face-detection,feature-detection,Image Processing,Crop,Face Detection,Feature Detection,我正在寻找一种最先进的方法，将图像裁剪成缩略图，同时保留图像的所有相关功能。这些图像是电视节目和电影中的剧照。他们是大超过1000像素，尖锐，通常非常平衡的色调，饱和度。我不在乎这是否是实时发生的这个问题是非常不适定的，因为它完全取决于你所说的所有相关特征我假设一部电视剧或电影中的相关特征可能是1张脸、2个人、3个标志，或者4个人可能会觉得有趣/突出的任何东西 1张脸。您可以运行一个人脸检测器，比如OpenCV内置的人脸检测器。这将使用Viola/Jones Haar cascade技术在

我正在寻找一种最先进的方法，将图像裁剪成缩略图，同时保留图像的所有相关功能。这些图像是电视节目和电影中的剧照。他们是大超过1000像素，尖锐，通常非常平衡的色调，饱和度。

我不在乎这是否是实时发生的

这个问题是非常不适定的，因为它完全取决于你所说的所有相关特征

我假设一部电视剧或电影中的相关特征可能是1张脸、2个人、3个标志，或者4个人可能会觉得有趣/突出的任何东西

1张脸。您可以运行一个人脸检测器，比如OpenCV内置的人脸检测器。这将使用Viola/Jones Haar cascade技术在图像中查找人脸，并返回这些人脸周围的一组框。然后可以将框架裁剪为仅包含这些框的区域。这不是最先进的技术，但它是最常用的人脸检测器，例如用于人脸探测器的摄像头硬件等

两个人。要检测行人，您可以使用标准的行人检测器，例如Dalal和Triggs-HOG/SVM方法，请参阅他们的CVPR 2005论文。这不是最先进的技术，但可能会做一个合理的工作，并且有大量的工作和实现来自于网络上可用的这种框架，例如搜索INRIA行人检测器

另一种选择是使用牛津VGG的上身/躯干检测器，它也是图像中人的合理预测工具，我相信它是在吸血鬼杀手布菲电视节目中训练出来的

3个标志。使用一个SIFT检测器和一个支持向量机的视觉单词包框架来稳健地找到这些单词。你可以通过谷歌搜索安德鲁·齐瑟曼（Andrew Zisserman）的牛津小组（Oxford）或加布里拉·苏尔卡（Gabriela Csurka）的XRCE格勒诺布尔小组（XRCE Grenoble）的各种论文，例如视频谷歌（Video google）等，以了解更多关于这些方法的信息，而在OpenCV中使用内置的特征检测器实现这些方法是相当简单的。一袋视觉文字的方法在这里就足够了，但基于Fisher向量的方法可能会被认为更接近最先进的水平

4.任何突出的问题。几十年来，计算机视觉研究人员一直试图为一般图像设计通用的任何有趣的检测器，但在我看来，还没有人找到一种适用于任何电视节目或电影的可用解决方案。如果你想再次尝试一些中档产品，不是最先进的产品，而是可能在www上免费提供代码的产品，你可以用谷歌搜索Itti-Koch方法