Scikit learn MeanShift`fit`vs`fit_predict`scikitlearn

Scikit learn MeanShift`fit`vs`fit_predict`scikitlearn,scikit-learn,Scikit Learn,假设X是一个典型形式的数组。给定代码 从sklearn.cluster导入MeanShift ms=MeanShift(bin\u种子设定=True,cluster\u all=False) 菲特女士(X) 一旦我这样做,ms有两个属性:标签和集群中心。所以我的第一个问题是。。。。ms.fit\u predict(X)或ms.predict(X)的意义是什么,因为我们已经有了一个X的分类,我们可以从标签中读取它?主要的区别是当你说,ms.fit(X),X是你的标签数据集/火车数据集。说到ms.

假设
X
是一个典型形式的数组。给定代码


从sklearn.cluster导入MeanShift
ms=MeanShift(bin\u种子设定=True,cluster\u all=False)
菲特女士(X)

一旦我这样做,
ms
有两个属性:
标签和
集群中心。所以我的第一个问题是。。。。
ms.fit\u predict(X)
ms.predict(X)
的意义是什么,因为我们已经有了一个X的分类,我们可以从
标签中读取它?

主要的区别是当你说,
ms.fit(X)
X
是你的标签数据集/火车数据集。说到
ms.fit\u predict(X')
X'
是您的未标记/测试数据集。即,您正在使用
fit\u predict
对未标记的数据集进行预测。 i、 e,
fit(X)
执行聚类,而,
fit\u predict
为您提供聚类标签。在
sklearn.cluster.mean\u shift\u MeanShift
对象上,没有比ms.predict(X)
更好的了。 另请参见下面的目录(ms)

>帮助(ms.fit)
模块sklearn.cluster.mean\u shift\中的方法匹配帮助:
sklearn.cluster.mean\u shift\u MeanShift实例的fit(self,X)方法
执行群集。
参数
-----------
X:类似数组,形状=[n_样本,n_特征]
样本聚类。
>>>帮助(fit_女士)
模块sklearn.base中关于方法拟合和预测的帮助:
sklearn.cluster.mean\u shift\uu.MeanShift实例的fit_predict(self,X,y=None)方法
在X上执行群集并返回群集标签。
参数
----------
X:n阵列,形状(n_样本,n_特征)
输入数据。
退换商品
-------
y:ndarray,形状(n_样本)
簇标签
主任(ms)
“UUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUU u'、uuu str_uuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuu“,”min_bin_freq“,”seeds“,”set_params“]

如果
ms
的属性为
\u标签
\u聚类中心
,使用
X
数据,则可以使用标准的mis分类惩罚技术估计模型的优度。您无法再使用
fit\u predict
进行评估,因为您将只获得标签,而不会获得群集中心。因此,由您自行设计群集中心,具体取决于您的优度标准。

来自sklearn.cluster import MeanShift ms=MeanShift()dir(ms)输出:['class','delattr','dict','doc','format','getattribute','hash','init','module','new','reduce','reduce_ex','repr','setattr','sizeof','str','subclass hook','weakref','get_param name','bandwidth','bin_seeding','cluster_all','fit','fit__predict','get_params','min_bin_freq','seed','set_参数']你看到上面的“predict”了吗?我们导入的是相同的模块吗?我正在运行scikit 15.2。从sklearn.cluster import meanshift我在“0.14.1”上,但在任何情况下,你都可以看到predict使用相同的结构做了什么。因为我没有它,所以我无法区分两者之间的区别。该死的,谢谢你。我觉得我看到
.labels\uUc很有趣ode>和
.cluster\u居中
即使在
ms.fit()之后
,所以我看不出
ms.fit\u()的原因
。进行升级!Hey只是想添加,有时最新的升级可能不可取,特别是如果您使用大量开源软件包,因为其中一些可能需要升级下游软件包。如果它们是beta/dev,则最好(通常通过pip_需求文件进行处理-保持生产机器的整洁和可重复生产。