Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/325.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何找到聚类算法的成功率?_Python_Image Processing_Cluster Analysis_Analysis - Fatal编程技术网

Python 如何找到聚类算法的成功率?

Python 如何找到聚类算法的成功率?,python,image-processing,cluster-analysis,analysis,Python,Image Processing,Cluster Analysis,Analysis,我在一个图像数据集上实现了几种聚类算法。 我对推导聚类的成功率感兴趣。我必须检测肿瘤区域,在原始图像中我知道肿瘤的位置,我想比较两张图像并获得成功率。 以下图片: 原始图像:我知道癌症的位置 图像聚类算法 我使用的是python 2.7。分割精度 这是图像分割文献中非常常见的问题,例如 一种常见的方法是考虑“正确的像素”与“不正确的像素”的比率,这在安全域,例如,图像分割< /强>中是常见的。p> 将其视为一项对象检测任务时,您可以利用对象外壳的重叠部分进行测量(通常分解为,以及使用其他度量)。

我在一个图像数据集上实现了几种聚类算法。 我对推导聚类的成功率感兴趣。我必须检测肿瘤区域,在原始图像中我知道肿瘤的位置,我想比较两张图像并获得成功率。 以下图片:

原始图像:我知道癌症的位置

图像聚类算法


我使用的是python 2.7。

分割精度

这是图像分割文献中非常常见的问题,例如

一种常见的方法是考虑“正确的像素”与“不正确的像素”的比率,这在安全域,例如,<强>图像分割< /强>中是常见的。p> 将其视为一项对象检测任务时,您可以利用对象外壳的重叠部分进行测量(通常分解为,以及使用其他度量)。这使您能够生成一个可针对误报/误报进行校准的

关于什么是正确的,没有领域不可知论的共识

Mask RCNN是最先进的开源软件,并提供了实现 python中的of

在您的领域(医学),标准统计规则适用。使用固定装置。交叉验证。等等(*)

注意:尽管文献空间大得吓人,但我要提醒你看一些与领域相关的论文,因为它们可能比其他视觉(例如数字识别)项目接受的“统计捷径”要少

  • “”在域中提供了一些摘要方法
  • “”有大约2500条引文,但有点老
  • “”更老一点,会让你安全地进入“传统”视觉模型
  • 主要是关于其细分验证过程

Python

除了上面的mask rcnn链接之外,它还提供了一些非常用户友好的工具,并且被认为是python标准科学“堆栈”的一部分

在python中实现图像之间的差异非常简单(使用numpy)。这里有一个过度的杀伤力

python中的边界框相交;我会使用像这样的图书馆

Scikit learn有一些不错的机器学习评估工具,例如


文献检索

您在搜索答案时可能遇到困难的一个原因是,您试图在监督学习领域中测量无监督方法(聚类)的性能。“集群”在数学(**)中基本上定义不足。您需要查看监督学习文献以了解准确度度量

也有关于无监督学习/聚类的文献,通常寻找拓扑结构。我不认为那是你想要的

一个常见的问题,特别是在规模上,是监督方法需要标签,这可以用于密集分割。目标检测

有一些现有的医学数据集(,例如)和。如果这些都不是您可以选择的,那么您可能不得不重新考虑将其视为一个无监督的问题,但评估的范围和实用性将变得非常不同


脚注

[*]愿景人士有时会跳过交叉验证,尽管他们不应该这样做,主要是因为模型拟合速度慢,而且他们是一群懒惰的人。请不要跳过a,否则您的结果可能会毫无用处


[**]你可以找到各种各样的“正式”定义,但从来没有两个人同意哪一个是正确的或最有用的

使用ROC曲线:很好的答案。我不确定还有什么可以补充的!