Machine learning 图像中的标志识别_Machine Learning_Computer Vision_Image Recognition

Machine learning 图像中的标志识别

machine-learning computer-vision

Machine learning 图像中的标志识别,machine-learning,computer-vision,image-recognition,Machine Learning,Computer Vision,Image Recognition,有人知道最近在图像中的标识识别方面所做的学术工作吗？请回答，只有当你熟悉这个特定的主题（我可以搜索谷歌的“标识识别”自己，非常感谢）。任何人谁是在计算机视觉知识，并已做了物体识别的工作，欢迎评论以及更新：请参考算法方面（您认为合适的方法，该领域的论文，它是否应该对真实世界的数据有效（并且已经过测试），效率方面的考虑），而不是技术方面（所使用的编程语言或是否与OpenCV一起使用…）在图像索引和基于内容的图像检索方面的工作也会有所帮助。我在一个项目中工作，我们必须做一些非常类似的事情。起

有人知道最近在图像中的标识识别方面所做的学术工作吗？请回答，只有当你熟悉这个特定的主题（我可以搜索谷歌的“标识识别”自己，非常感谢）。任何人谁是在计算机视觉知识，并已做了物体识别的工作，欢迎评论以及

更新：请参考算法方面（您认为合适的方法，该领域的论文，它是否应该对真实世界的数据有效（并且已经过测试），效率方面的考虑），而不是技术方面（所使用的编程语言或是否与OpenCV一起使用…）

在图像索引和基于内容的图像检索方面的工作也会有所帮助。

我在一个项目中工作，我们必须做一些非常类似的事情。起初，我尝试使用这个软件使用Haar训练技术

它起作用了，但不是满足我们需求的最佳解决方案。我们的源图像（我们正在寻找徽标）是固定大小的，只包含徽标。因此，我们可以将cvMatchShapes与已知的良好匹配项一起使用，并比较返回的值以将其视为良好匹配项。

您可以尝试在此处使用SIFT等本地功能：

它应该可以工作，因为标志形状通常是恒定的，所以提取的特征应该匹配得很好

工作流程如下所示：

检测角点（例如哈里斯角点检测器）-对于Nike徽标，它们是两个尖头

计算描述符（如SIFT-128D整数向量）

在训练阶段记住它们；在匹配阶段，为训练期间获得的数据库中的每个特征寻找最近邻。最后，您有一组匹配项（其中一些可能是错误的）

使用RANSAC找出错误的匹配项。因此，您将得到描述从理想徽标图像到找到徽标的图像的变换的矩阵。根据设置，可以允许不同类型的变换（仅平移；平移和旋转；仿射变换）

塞利斯基的书中有一章（4.1）是关于地方特色的。

附言

我假设你想在照片中找到标识，比如找到所有百事可乐的广告牌，这样它们可能会被扭曲。如果你需要在屏幕上找到一个电视频道的标志（这样它就不会旋转和缩放），你可以做得更简单（模式匹配或其他）

>P>常规SIFT不考虑颜色信息。由于标志通常具有恒定的颜色（虽然确切的颜色取决于闪电和相机），你可能想考虑颜色信息不知怎么回事。

致力于：体育视频数据库中的商标匹配和检索获取该论文的PDF格式：

我们使用SIFT作为商标和图像描述符，并使用归一化阈值匹配来计算模型和图像之间的距离。在我们最近的工作中，我们已经能够使用元模型大大减少计算量，这些元模型用于评估同一商标的不同版本中存在的SIFT点的相关性

我要说的是，由于目前使用的电视标准的视觉质量非常差，一般来说，处理视频比处理照片更难

Marco

我们致力于真实图像中的徽标检测/识别。我们还创建了一个数据集，并将其公开，包括数据、基本事实和评估脚本

在我们的工作中，我们将徽标识别视为检索问题，以简化多类识别，并允许此类系统易于扩展到多个（例如数千个）徽标类

最近，我们开发了一种称为Bundle-min-Hashing的捆绑技术，该技术将多个局部特征的空间配置聚合为高度独特的特征束。束表示可用于检索和识别。有关徽标检测，请参见以下示例热图：

您将在论文中找到更多关于内部操作、该方法的潜在应用、性能试验的详细信息，当然还有许多相关工作的参考资料。

如果您能告诉我们您在寻找什么以及“认真”是什么意思，您可以提高获得好答案的机会。我在计算机视觉/物体识别领域工作了10多年，但我甚至不确定“标识识别”是什么意思。标识识别指的是，例如，获取包含可口可乐标识/商标的图像，检测标识并将其标记为“可口可乐”。在这个领域工作10年对我来说是很严肃的。（我主要是想避免下面的答案，这些答案信息不多）你有没有找到其他方法来解决你的问题？因为问题是世界上有成千上万的徽标，所以识别徽标有点困难…我考虑过弓的功能，但是我们有针对每种徽标的课程吗？谢谢。这种方法听起来很合理。关于每个功能的最近邻-这听起来相当密集（我计划有数千个标识被识别），你认为什么是优化的好方法？我想到了矢量量化或近似近邻…莉莎，你是对的，很难在128D中找到NN。目前最先进的是通过kd树或k-均值树森林进行近似神经网络搜索。它是在Muja Lowe FLANN中实现的：再次感谢。还发现了这些涉及可伸缩和高效图像识别的论文：*Torralba、Fergus、Weiss的“用于识别的小型代码和大型图像数据库”*“具有词汇树的可伸缩识别”由Nister和Stewenius实现了MATLAB和C的SIFT（以及其他一些计算机视觉算法）@SuzanCioc首先，你需要一套训练标志。例如，您可以拥有用边界框标注徽标的图片。然后您可以提取描述符，并标记t