Machine learning 有人能为CBIR提出好的算法吗？_Machine Learning_Artificial Intelligence_Computer Vision_Image Recognition_Cbir

Machine learning 有人能为CBIR提出好的算法吗？

machine-learning artificial-intelligence computer-vision

Machine learning 有人能为CBIR提出好的算法吗？,machine-learning,artificial-intelligence,computer-vision,image-recognition,cbir,Machine Learning,Artificial Intelligence,Computer Vision,Image Recognition,Cbir,项目：基于内容的图像检索-半监督（在培训期间对图像进行手动标记）描述我在数据库中有1000000张图片。培训是手动的（有监督的）-为每个图像提供标题和标签。例子：可口可乐.jpg 标题：可乐标签：可乐，罐头使用图像和标签，我必须训练系统。培训后，当我给出一个新图像（已在数据库中/全新）时，系统应输出图像可能属于的标签，并显示属于每个标签的少量图像。系统也可能会说找不到匹配项问题: 1）什么是图像指纹？预期的图像指纹大小是多少？（很重要，因为将有数以百万计的图像插入数据库） 2）

项目：基于内容的图像检索-半监督（在培训期间对图像进行手动标记）

描述

我在数据库中有1000000张图片。培训是手动的（有监督的）-为每个图像提供标题和标签。例子：可口可乐.jpg 标题：可乐标签：可乐，罐头

使用图像和标签，我必须训练系统。培训后，当我给出一个新图像（已在数据库中/全新）时，系统应输出图像可能属于的标签，并显示属于每个标签的少量图像。系统也可能会说找不到匹配项

问题:

1）什么是图像指纹？预期的图像指纹大小是多少？（很重要，因为将有数以百万计的图像插入数据库）

2）数据库中指纹的字段格式是什么？（非常重要，因为需要快速搜索…脚本应在不到1秒的时间内搜索1M图像数据库）

3）我们用来分析它们的描述符（算法）是什么

提前谢谢

图像指纹：图像的有意义表示。当然，不能使用单个像素。最合理的方法是尽量减少基础之间的相关性。简单地说，如果您使用64x64图像，左上角的两个像素可能相同或相似。使用每个64^2像素作为输入是没有用的，您需要更好的东西。试着看看主成分分析的作用

这完全取决于你。你可以使用一点，告诉你图像是否暗。更好的方法是，对图像进行PCA，并使用不同数量的特征进行实验（并非总是特征越多越好）

不管你想要什么，有很多算法可以使用。我推荐支持向量机。易于使用和良好的支持。如果你有很多不同的标签，你可能需要为每个标签放置一个SVM。这可能并不理想，您可能想尝试其他方法

我建议在从训练图像中提取的图像特征列表上训练SVM模型。好吧，这个主题非常大，但这里是一个可能解决方案的简要概述

图像指纹是SIFT描述符的集合这些都是量化的，以减少大小，并允许索引

建立数据库的反向索引，以便通过量化描述符查找图像（您可以使用任何全文搜索引擎\DB进行此操作）

给定一个图像，查找共享大量公共描述符的图像

对于那些潜在的候选者，您应该验证描述符的空间排列是否足够相似

以下是一些帮助您入门的文章：

我想指纹是指图像的特征向量。是的，但你能告诉我指纹的大小和存储方式吗？每个图像1个，每个标签1个，或者标签组合1个…因为有数百万张图像…你能分享使用哪些特征提取方法吗。。。感谢您的回复…显然，必须为每个图像计算“图像的特征向量”。尝试阅读一些关于图像分类的研究论文。我想你的问题没有一个正确答案。谢谢。。。首先，你能提出一些算法和相应的指纹大小、字段。。。。我会接受你的建议，看一些报纸。谢谢你的回复。。。。我将通过上述参考资料，并为我的项目尝试\