Image 确定标记/关键字是否与图像相关的简单但相当准确的算法

Image 确定标记/关键字是否与图像相关的简单但相当准确的算法,image,algorithm,tags,keyword,training-data,Image,Algorithm,Tags,Keyword,Training Data,我有一个很难解决的问题,这是关于自动图像关键字。您可以假设我有一个数据库,其中包含100000+个用于训练的关键字低质量jpeg图像(低质量=低分辨率约300x300px+低压缩比)。每幅图像大约有40个最准确的关键词(数据可能包含轻微的“噪音”)。我还可以提取一些关于关键字相关性的数据 给定一幅彩色图像和一个关键字,我想确定该关键字与该图像相关的概率 我需要一个可以理解的创造性解决方案,我可以在大约一个月或更短的时间内自己实现(我计划使用python)。到目前为止,我发现的是机器学习、神经网络

我有一个很难解决的问题,这是关于自动图像关键字。您可以假设我有一个数据库,其中包含100000+个用于训练的关键字低质量jpeg图像(低质量=低分辨率约300x300px+低压缩比)。每幅图像大约有40个最准确的关键词(数据可能包含轻微的“噪音”)。我还可以提取一些关于关键字相关性的数据

给定一幅彩色图像和一个关键字,我想确定该关键字与该图像相关的概率

我需要一个可以理解的创造性解决方案,我可以在大约一个月或更短的时间内自己实现(我计划使用python)。到目前为止,我发现的是机器学习、神经网络和遗传算法。我也在考虑为每个关键字生成某种签名,然后用它来检查尚未看到的图像

如果可行,疯狂/新奇的想法也会受到赞赏。我也愿意使用其他python库


我目前的算法非常复杂,计算量很大。它建议使用关键词而不是计算概率,并且50%的建议关键词不准确。

鉴于应用程序的苛刻要求,只能提出粗俗和无脑的解决方案

对于每幅图像,使用一些分割方法并保留(比如)四个最大的片段。区分其中一个或两个作为背景(延伸到图像边界的),其他作为前景或感兴趣的项目

根据主色(使用基于颜色原色的非常粗略的分类)和形状(相对于图像的大小、圆度、孔数、主方向和其他一些)对片段进行表征


然后,对于每个关键字,您可以构建一个分类器,以确定给定图像是否具有该关键字。训练后,分类器将告诉您图像是否包含关键字。如果你使用模糊分类,你会得到一个“概率”。

你要求的是一种能够对图像进行语义分析的算法——或多或少是计算机视觉的圣杯。你能稍微限制一下这个领域吗?有问题的照片有一个或几个“主题”吗?照片可以是任何东西。现在它们大多是抽象的图像。从云到复杂的模式,通常没有人或文本。这其实不错,而且听起来是可行的,特别是如果我能找到一些现成的库来使用的话。将图像分解为不同的区域,为每个区域分配多个度量,并根据这些度量中的模式以某种方式确定类。你能推荐一个好的分类器算法吗?听起来像我需要的,而且似乎有很好的文档记录。谢谢,我会接受你的回答:)