Machine learning 图像中的标志识别
有人知道最近在图像中的标识识别方面所做的学术工作吗? 请回答,只有当你熟悉这个特定的主题(我可以搜索谷歌的“标识识别”自己,非常感谢)。 任何人谁是在计算机视觉知识,并已做了物体识别的工作,欢迎评论以及 更新: 请参考算法方面(您认为合适的方法,该领域的论文,它是否应该对真实世界的数据有效(并且已经过测试),效率方面的考虑),而不是技术方面(所使用的编程语言或是否与OpenCV一起使用…)Machine learning 图像中的标志识别,machine-learning,computer-vision,image-recognition,Machine Learning,Computer Vision,Image Recognition,有人知道最近在图像中的标识识别方面所做的学术工作吗? 请回答,只有当你熟悉这个特定的主题(我可以搜索谷歌的“标识识别”自己,非常感谢)。 任何人谁是在计算机视觉知识,并已做了物体识别的工作,欢迎评论以及 更新: 请参考算法方面(您认为合适的方法,该领域的论文,它是否应该对真实世界的数据有效(并且已经过测试),效率方面的考虑),而不是技术方面(所使用的编程语言或是否与OpenCV一起使用…) 在图像索引和基于内容的图像检索方面的工作也会有所帮助。我在一个项目中工作,我们必须做一些非常类似的事情。起
在图像索引和基于内容的图像检索方面的工作也会有所帮助。我在一个项目中工作,我们必须做一些非常类似的事情。起初,我尝试使用这个软件使用Haar训练技术
它起作用了,但不是满足我们需求的最佳解决方案。我们的源图像(我们正在寻找徽标)是固定大小的,只包含徽标。因此,我们可以将cvMatchShapes与已知的良好匹配项一起使用,并比较返回的值以将其视为良好匹配项。您可以尝试在此处使用SIFT等本地功能: 它应该可以工作,因为标志形状通常是恒定的,所以提取的特征应该匹配得很好 工作流程如下所示:
致力于:体育视频数据库中的商标匹配和检索 获取该论文的PDF格式: 我们使用SIFT作为商标和图像描述符,并使用归一化阈值匹配来计算模型和图像之间的距离。在我们最近的工作中,我们已经能够使用元模型大大减少计算量,这些元模型用于评估同一商标的不同版本中存在的SIFT点的相关性 我要说的是,由于目前使用的电视标准的视觉质量非常差,一般来说,处理视频比处理照片更难
Marco我们致力于真实图像中的徽标检测/识别。我们还创建了一个数据集,并将其公开,包括数据、基本事实和评估脚本 在我们的工作中,我们将徽标识别视为检索问题,以简化多类识别,并允许此类系统易于扩展到多个(例如数千个)徽标类 最近,我们开发了一种称为Bundle-min-Hashing的捆绑技术,该技术将多个局部特征的空间配置聚合为高度独特的特征束。束表示可用于检索和识别。有关徽标检测,请参见以下示例热图:
您将在论文中找到更多关于内部操作、该方法的潜在应用、性能试验的详细信息,当然还有许多相关工作的参考资料。如果您能告诉我们您在寻找什么以及“认真”是什么意思,您可以提高获得好答案的机会。我在计算机视觉/物体识别领域工作了10多年,但我甚至不确定“标识识别”是什么意思。标识识别指的是,例如,获取包含可口可乐标识/商标的图像,检测标识并将其标记为“可口可乐”。在这个领域工作10年对我来说是很严肃的。(我主要是想避免下面的答案,这些答案信息不多)你有没有找到其他方法来解决你的问题?因为问题是世界上有成千上万的徽标,所以识别徽标有点困难…我考虑过弓的功能,但是我们有针对每种徽标的课程吗?谢谢。这种方法听起来很合理。关于每个功能的最近邻-这听起来相当密集(我计划有数千个标识被识别),你认为什么是优化的好方法?我想到了矢量量化或近似近邻…莉莎,你是对的,很难在128D中找到NN。目前最先进的是通过kd树或k-均值树森林进行近似神经网络搜索。它是在Muja Lowe FLANN中实现的:再次感谢。还发现了这些涉及可伸缩和高效图像识别的论文:*Torralba、Fergus、Weiss的“用于识别的小型代码和大型图像数据库”*“具有词汇树的可伸缩识别”由Nister和Stewenius实现了MATLAB和C的SIFT(以及其他一些计算机视觉算法)@SuzanCioc首先,你需要一套训练标志。例如,您可以拥有用边界框标注徽标的图片。然后您可以提取描述符,并标记t