Machine learning 图像中的标志识别

Machine learning 图像中的标志识别,machine-learning,computer-vision,image-recognition,Machine Learning,Computer Vision,Image Recognition,有人知道最近在图像中的标识识别方面所做的学术工作吗? 请回答,只有当你熟悉这个特定的主题(我可以搜索谷歌的“标识识别”自己,非常感谢)。 任何人谁是在计算机视觉知识,并已做了物体识别的工作,欢迎评论以及 更新: 请参考算法方面(您认为合适的方法,该领域的论文,它是否应该对真实世界的数据有效(并且已经过测试),效率方面的考虑),而不是技术方面(所使用的编程语言或是否与OpenCV一起使用…) 在图像索引和基于内容的图像检索方面的工作也会有所帮助。我在一个项目中工作,我们必须做一些非常类似的事情。起

有人知道最近在图像中的标识识别方面所做的学术工作吗? 请回答,只有当你熟悉这个特定的主题(我可以搜索谷歌的“标识识别”自己,非常感谢)。 任何人谁是在计算机视觉知识,并已做了物体识别的工作,欢迎评论以及

更新: 请参考算法方面(您认为合适的方法,该领域的论文,它是否应该对真实世界的数据有效(并且已经过测试),效率方面的考虑),而不是技术方面(所使用的编程语言或是否与OpenCV一起使用…)
在图像索引和基于内容的图像检索方面的工作也会有所帮助。

我在一个项目中工作,我们必须做一些非常类似的事情。起初,我尝试使用这个软件使用Haar训练技术


它起作用了,但不是满足我们需求的最佳解决方案。我们的源图像(我们正在寻找徽标)是固定大小的,只包含徽标。因此,我们可以将cvMatchShapes与已知的良好匹配项一起使用,并比较返回的值以将其视为良好匹配项。

您可以尝试在此处使用SIFT等本地功能:

它应该可以工作,因为标志形状通常是恒定的,所以提取的特征应该匹配得很好

工作流程如下所示:

  • 检测角点(例如哈里斯角点检测器)-对于Nike徽标,它们是两个尖头

  • 计算描述符(如SIFT-128D整数向量)

  • 在训练阶段记住它们;在匹配阶段,为训练期间获得的数据库中的每个特征寻找最近邻。最后,您有一组匹配项(其中一些可能是错误的)

  • 使用RANSAC找出错误的匹配项。因此,您将得到描述从理想徽标图像到找到徽标的图像的变换的矩阵。根据设置,可以允许不同类型的变换(仅平移;平移和旋转;仿射变换)

  • 塞利斯基的书中有一章(4.1)是关于地方特色的。

    附言

  • 我假设你想在照片中找到标识,比如找到所有百事可乐的广告牌,这样它们可能会被扭曲。如果你需要在屏幕上找到一个电视频道的标志(这样它就不会旋转和缩放),你可以做得更简单(模式匹配或其他)

  • >P>常规SIFT不考虑颜色信息。由于标志通常具有恒定的颜色(虽然确切的颜色取决于闪电和相机),你可能想考虑颜色信息不知怎么回事。


    致力于:体育视频数据库中的商标匹配和检索 获取该论文的PDF格式:

    我们使用SIFT作为商标和图像描述符,并使用归一化阈值匹配来计算模型和图像之间的距离。在我们最近的工作中,我们已经能够使用元模型大大减少计算量,这些元模型用于评估同一商标的不同版本中存在的SIFT点的相关性

    我要说的是,由于目前使用的电视标准的视觉质量非常差,一般来说,处理视频比处理照片更难


    Marco

    我们致力于真实图像中的徽标检测/识别。我们还创建了一个数据集,并将其公开,包括数据、基本事实和评估脚本

    在我们的工作中,我们将徽标识别视为检索问题,以简化多类识别,并允许此类系统易于扩展到多个(例如数千个)徽标类

    最近,我们开发了一种称为Bundle-min-Hashing的捆绑技术,该技术将多个局部特征的空间配置聚合为高度独特的特征束。束表示可用于检索和识别。有关徽标检测,请参见以下示例热图:


    您将在论文中找到更多关于内部操作、该方法的潜在应用、性能试验的详细信息,当然还有许多相关工作的参考资料。

    如果您能告诉我们您在寻找什么以及“认真”是什么意思,您可以提高获得好答案的机会。我在计算机视觉/物体识别领域工作了10多年,但我甚至不确定“标识识别”是什么意思。标识识别指的是,例如,获取包含可口可乐标识/商标的图像,检测标识并将其标记为“可口可乐”。在这个领域工作10年对我来说是很严肃的。(我主要是想避免下面的答案,这些答案信息不多)你有没有找到其他方法来解决你的问题?因为问题是世界上有成千上万的徽标,所以识别徽标有点困难…我考虑过弓的功能,但是我们有针对每种徽标的课程吗?谢谢。这种方法听起来很合理。关于每个功能的最近邻-这听起来相当密集(我计划有数千个标识被识别),你认为什么是优化的好方法?我想到了矢量量化或近似近邻…莉莎,你是对的,很难在128D中找到NN。目前最先进的是通过kd树或k-均值树森林进行近似神经网络搜索。它是在Muja Lowe FLANN中实现的:再次感谢。还发现了这些涉及可伸缩和高效图像识别的论文:*Torralba、Fergus、Weiss的“用于识别的小型代码和大型图像数据库”*“具有词汇树的可伸缩识别”由Nister和Stewenius实现了MATLAB和C的SIFT(以及其他一些计算机视觉算法)@SuzanCioc首先,你需要一套训练标志。例如,您可以拥有用边界框标注徽标的图片。然后您可以提取描述符,并标记t