Machine learning 基于内容的图像检索?

Machine learning 基于内容的图像检索?,machine-learning,computer-vision,Machine Learning,Computer Vision,我在谷歌上搜索了基于内容的图像检索CBIR,事实上维基的定义很明确,但与该主题相关的材料和书籍并不多。有人能解释一下构成基于内容的图像检索和任何资源的组件是什么吗?基于内容的图像检索CBIR的任务可以这样描述:给定一个查询图像,在数据库中查找相似的图像 据我所知,CBIR有三个基本步骤 1特征提取:为数据库中的图像和查询图像提取有用的特征来描述图像 2匹配:再次计算数据库图像中提取的查询特征之间的距离,并根据到查询的距离对数据库图像进行排序 3细化:细化匹配项并对其重新排序 到目前为止,最主要的

我在谷歌上搜索了基于内容的图像检索CBIR,事实上维基的定义很明确,但与该主题相关的材料和书籍并不多。有人能解释一下构成基于内容的图像检索和任何资源的组件是什么吗?

基于内容的图像检索CBIR的任务可以这样描述:给定一个查询图像,在数据库中查找相似的图像

据我所知,CBIR有三个基本步骤 1特征提取:为数据库中的图像和查询图像提取有用的特征来描述图像 2匹配:再次计算数据库图像中提取的查询特征之间的距离,并根据到查询的距离对数据库图像进行排序 3细化:细化匹配项并对其重新排序

到目前为止,最主要的工作是在第一步,特征提取:

传统上,手工制作的本地特征筛选、冲浪等是最常用的。 最近,研究人员提出使用编码方法,如单词袋、VLAD、Fisher向量等,从原始的局部特征生成紧凑的描述符。好处有两个:i紧凑的描述符比原始的局部特征更可靠;ii紧凑型描述符的足迹比原始特征小,因此更易于扩展,适合大规模检索 最近,随着计算机视觉中深度学习的巨大成功,人们开始使用从卷积神经网络CNN代码中学习到的特征来取代局部手工特征。CNN代码可按原样使用,或与上述某些编码方法结合使用。总的来说,CNN代码的性能优于一些标准基准上确认的手工功能,如Holiday dataset、Oxford5K、Oxford100K、Paris、UKB b对于第二步:一些简单的距离度量可以完成欧几里得距离、余弦距离等工作

c可使用RANSAC或先验知识执行最后一步重新排序。其实我对这一步不太了解


使用上面文本中的一些关键词,您可以通过Google找到有用的资源。

基于内容的图像检索CBIR可以简单地视为给定的查询图像,根据查询图像的内容获取与查询图像最相似的排名表。传统的方法包括词汇树方法。您可以签出此库以了解详细信息


此外,最近深度学习的成功也带来了新的方法。深度学习方法通常不依赖于局部特征,而是依赖于全局图像描述。这是另一个巨大的话题。

hmm,维基页面列出了大约50篇相关的研究论文——这些对你来说不相关的资源吗?嗯。我认为你需要重新表述你的问题,因为它看起来离题太广,研究要求也太高。试着问一个特定的问题,而不是一个非常开放的要求,你可能会得到一些答复。