Image 数据聚类如何帮助图像或模式识别

Image 数据聚类如何帮助图像或模式识别,image,cluster-analysis,image-recognition,face-recognition,Image,Cluster Analysis,Image Recognition,Face Recognition,我一直在玩弄不同的数据聚类算法,致力于在代表节点的随机数据点之间寻找聚类,我一直在阅读数据聚类用于图像识别。我无法建立联系,聚类数据如何帮助识别图像或面部识别。有人能解释这一点吗?聚类被广泛用于模式识别,尤其是图像识别,这并不奇怪:聚类是一个缩小的过程,在这个百万像素的时代,图像需要浓缩。。。这也是一个产生类别的过程,当然是有用的 然而,使用聚类作为图像识别技术有很多方法。这种多样性的原因之一是,聚类可以应用于不同的级别,用于不同的目的:从基本像素级别到特征级别(特征可以是直线、几何图形……),

我一直在玩弄不同的数据聚类算法,致力于在代表节点的随机数据点之间寻找聚类,我一直在阅读数据聚类用于图像识别。我无法建立联系,聚类数据如何帮助识别图像或面部识别。有人能解释这一点吗?

聚类被广泛用于模式识别,尤其是图像识别,这并不奇怪:聚类是一个缩小的过程,在这个百万像素的时代,图像需要浓缩。。。这也是一个产生类别的过程,当然是有用的

然而,使用聚类作为图像识别技术有很多方法。这种多样性的原因之一是,聚类可以应用于不同的级别,用于不同的目的:从基本像素级别到特征级别(特征可以是直线、几何图形……),用于分类或其他目的

在非常高的层次上,聚类是一种统计工具,它有助于发现在定义特定项目属于特定类别时各个维度的相对重要性

这种工具的一种[多种]用法是监督学习,即将一组人类选择的项目(如图像)输入基于集群的逻辑,以及与特定项目相关联的标签(“这是一个苹果”、“这是另一个苹果”、“这是一个柠檬”…),然后,聚类逻辑确定输入的每个维度在多大程度上有助于每组项目(苹果、柠檬……)适合一个不同的聚类(例如颜色可能影响相对较小,但形状、点的存在或其他可能影响很大的因素)。在这个训练阶段之后,可以将新的图像输入到逻辑中,通过观察该图像与特定集群的距离,可以“识别”(作为香蕉!)

当涉及到图像处理时,我们需要记住,“馈送”到聚类逻辑的不一定是(事实上,很少)原始像素,而是各种“对象” 描述原始数据的各种“元素”(基本上是相对高维向量的集合,与其他数据聚类示例中可能遇到的一些向量不同),并由过程的前几个阶段生成。例如,面部识别的一个重要因素可能是眼睛中心之间的精确距离。在前面的阶段中,图像的处理方式可以确定眼睛的位置(可能依赖于另一种基于聚类的逻辑)。然后,眼睛之间的距离以及许多其他元素被提供给最终的聚类逻辑

前面的描述只是使用聚类进行图像识别的一个示例。事实上,各种形式的神经网络在这一领域得到了非常成功的应用,可以说,在某种意义上,这些神经网络是聚类信息。神经网络成功的原因之一可能在于它们能够更加尊重原始输入中的局部性维度,并且能够以分层方式工作

这篇文章的一个很好的结论是列出一个简短的在线资源列表,但我现在时间紧迫。。。“待续”——)

第二天编辑:(未能提供有关该主题的介绍性在线参考书目)

我搜索了有关聚类应用于人工视觉和图像处理的文献,发现了两个不同的主题。。。簇;-)

  • 《图像处理和计算机视觉算法》J Parkey-pub-Wiley或《机器视觉:理论、算法、实用性》等书籍,M Seul等人出版。这类书籍通常涵盖与降噪、边缘检测、颜色或强度转换相关的所有重要技术,以及图像处理链中的许多其他元素,其中大多数不涉及聚类或甚至统计方法,并且它们仅保留一章或两章,甚至很少提及聚类,应用于模式识别或其他任务
  • 学术论文和会议手册,专门涵盖应用于人工视觉等的聚类技术,但以最狭隘和最深入的方式(例如:用于字符识别的Fukunaga和Narendra算法的变体,或用于在任何上下文中选择最近邻候选对象的快速方法。)
简言之,我觉得没有能力提出任何具体的书籍或文章建议

你可能会发现,通过“人工视觉”或“图像识别”或上面提到的一些标题,浏览谷歌图书中的标题会提供信息。通过预览功能和标签云(顺便说一句,聚类的另一个应用程序)可以在“关于这本书”中找到链接,你可以对各种书籍的内容有一个很好的了解,并可能决定购买其中的一些。不幸的是,读者数量的减少和该领域潜在的利润丰厚的应用使得这些书籍相对昂贵。在另一方面,你可以下载,有时是免费的,讨论高等教育的研究论文这些图片也会出现在普通的(网络)谷歌上,或者出现在专门的存储库中,比如


祝您在该领域的探索好运!

ty,等待下一部分