Machine learning 有人能为CBIR提出好的算法吗?

Machine learning 有人能为CBIR提出好的算法吗?,machine-learning,artificial-intelligence,computer-vision,image-recognition,cbir,Machine Learning,Artificial Intelligence,Computer Vision,Image Recognition,Cbir,项目:基于内容的图像检索-半监督(在培训期间对图像进行手动标记) 描述 我在数据库中有1000000张图片。培训是手动的(有监督的)-为每个图像提供标题和标签。 例子: 可口可乐.jpg 标题:可乐 标签:可乐,罐头 使用图像和标签,我必须训练系统。培训后,当我给出一个新图像(已在数据库中/全新)时,系统应输出图像可能属于的标签,并显示属于每个标签的少量图像。系统也可能会说找不到匹配项 问题: 1) 什么是图像指纹?预期的图像指纹大小是多少?(很重要,因为将有数以百万计的图像插入数据库) 2)

项目:基于内容的图像检索-半监督(在培训期间对图像进行手动标记)

描述

我在数据库中有1000000张图片。培训是手动的(有监督的)-为每个图像提供标题和标签。 例子: 可口可乐.jpg 标题:可乐 标签:可乐,罐头

使用图像和标签,我必须训练系统。培训后,当我给出一个新图像(已在数据库中/全新)时,系统应输出图像可能属于的标签,并显示属于每个标签的少量图像。系统也可能会说找不到匹配项

问题:

1) 什么是图像指纹?预期的图像指纹大小是多少?(很重要,因为将有数以百万计的图像插入数据库)

2) 数据库中指纹的字段格式是什么?(非常重要,因为需要快速搜索…脚本应在不到1秒的时间内搜索1M图像数据库)

3) 我们用来分析它们的描述符(算法)是什么

提前谢谢

  • 图像指纹:图像的有意义表示。当然,不能使用单个像素。最合理的方法是尽量减少基础之间的相关性。简单地说,如果您使用64x64图像,左上角的两个像素可能相同或相似。使用每个64^2像素作为输入是没有用的,您需要更好的东西。试着看看主成分分析的作用
  • 这完全取决于你。你可以使用一点,告诉你图像是否暗。更好的方法是,对图像进行PCA,并使用不同数量的特征进行实验(并非总是特征越多越好)
  • 不管你想要什么,有很多算法可以使用。我推荐支持向量机。易于使用和良好的支持。如果你有很多不同的标签,你可能需要为每个标签放置一个SVM。这可能并不理想,您可能想尝试其他方法

  • 我建议在从训练图像中提取的图像特征列表上训练SVM模型。好吧,这个主题非常大,但这里是一个可能解决方案的简要概述

  • 图像指纹是SIFT描述符的集合 这些都是量化的,以减少大小,并允许索引

  • 建立数据库的反向索引,以便通过量化描述符查找图像(您可以使用任何全文搜索引擎\DB进行此操作)

  • 给定一个图像,查找共享大量公共描述符的图像

  • 对于那些潜在的候选者,您应该验证描述符的空间排列是否足够相似

  • 以下是一些帮助您入门的文章:


    我想指纹是指图像的特征向量。是的,但你能告诉我指纹的大小和存储方式吗?每个图像1个,每个标签1个,或者标签组合1个…因为有数百万张图像…你能分享使用哪些特征提取方法吗。。。感谢您的回复…显然,必须为每个图像计算“图像的特征向量”。尝试阅读一些关于图像分类的研究论文。我想你的问题没有一个正确答案。谢谢。。。首先,你能提出一些算法和相应的指纹大小、字段。。。。我会接受你的建议,看一些报纸。谢谢你的回复。。。。我将通过上述参考资料,并为我的项目尝试\