Machine learning 将具有名称的相似图像分组

Machine learning 将具有名称的相似图像分组,machine-learning,python-imaging-library,scikit-image,Machine Learning,Python Imaging Library,Scikit Image,我有数百张图片需要组合在一起。所有图像中都有名称和颜色。有没有一种最简单的方法可以根据里面的名字和颜色对它们进行分组?Python或任何算法中是否有可用的包可以实现这一点 例如,上面的图像中有“男孩”。如果我有另一个相似的图像,其中有相同的名称。那么我如何将它们组合在一起。如果文本如此清晰,您甚至可能不需要机器学习:只需使用名称作为键将字典中具有相同名称的所有项进行组合。如果文本仍然清晰,但您希望将namestem或的共轭词分组,请使用NLTK对其进行柠檬化。如果文本清晰,但您希望对语义相关的单

我有数百张图片需要组合在一起。所有图像中都有名称和颜色。有没有一种最简单的方法可以根据里面的名字和颜色对它们进行分组?Python或任何算法中是否有可用的包可以实现这一点


例如,上面的图像中有“男孩”。如果我有另一个相似的图像,其中有相同的名称。那么我如何将它们组合在一起。

如果文本如此清晰,您甚至可能不需要机器学习:只需使用名称作为键将字典中具有相同名称的所有项进行组合。如果文本仍然清晰,但您希望将namestem的共轭词分组,请使用NLTK对其进行柠檬化。如果文本清晰,但您希望对语义相关的单词进行分组,而不仅仅是共轭词,请使用主题模型word2vec,这将为您提供每个单词的向量空间嵌入,然后您可以使用它们执行相似性搜索


我已经强调了帮助你自助的关键术语。您的问题的技术术语称为聚类

您是否需要关于如何识别文本、识别背景颜色或提取这些特征后采取的步骤的建议?我想识别图像中的文本,如果我有与上述类似的图像,我希望能够将它们组合在一起。如果它们都使用相同的字体,那么您可以从提取每个字符开始(抓取图像中的黑色区域,标记它们)并执行类似的操作。如果不需要识别文本,可能还有一种更简单的方法:使用阈值提取前景,并使用欧几里德距离直接比较图像(假设文本以相同的方式居中)。文本颜色,字体和位置并非在所有情况下都是相似的。你认为即使是基于文本的情况下,我也可以将相似的图像分组在一起吗?或者还有其他方法可以将相似的图像分组在一起吗?我想知道的是如何读取图像中的文本并将图像与相似的文本分组如果文本始终与此图像中的文本一样清晰,只需通过
tesseract
,然后按照上面所述对文本进行聚类。tesseract看起来是一个很棒的解决方案。谢谢埃姆雷!