Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/306.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 使用sklearn KMeans与SciPy KMeans相比有什么优势吗?_Python_Scipy_Scikit Learn_Cluster Analysis_K Means - Fatal编程技术网

Python 使用sklearn KMeans与SciPy KMeans相比有什么优势吗?

Python 使用sklearn KMeans与SciPy KMeans相比有什么优势吗?,python,scipy,scikit-learn,cluster-analysis,k-means,Python,Scipy,Scikit Learn,Cluster Analysis,K Means,根据 类sklearn.cluster.KMeans(n_clusters=8,init='k-means++', n_init=10,max_iter=300,tol=0.0001,预计算距离为自动, 详细=0,随机状态=None,复制=True,n_作业=1) 及 scipy.cluster.vq.kmeans(obs,k_或k_guess,iter=20,thresh=1e-05, 检查(有限=真) 很明显,参数的数量不同,可能更多的参数可供sklearn使用 你们中有没有人试过一种方法与

根据

类sklearn.cluster.KMeans(n_clusters=8,init='k-means++', n_init=10,max_iter=300,tol=0.0001,预计算距离为自动, 详细=0,随机状态=None,复制=True,n_作业=1)

scipy.cluster.vq.kmeans(obs,k_或k_guess,iter=20,thresh=1e-05, 检查(有限=真)

很明显,参数的数量不同,可能更多的参数可供sklearn使用


你们中有没有人试过一种方法与另一种方法相比,在分类问题中,你们是否更愿意使用其中一种方法?

基准测试


而且你再也不会碰这个小玩意儿了。

如果不试一下,我总是更喜欢sklearn。更好的文档(包括用户指南)和更多您可能会使用的工具,如交叉验证/网格搜索。但这只是我的观点。scipy实现让您可以选择设置自己的质心,这很好。还要注意的是,对于大多数应用程序,您都希望使用,而不是您引用的应用程序。除此之外,我也说不上来。似乎很难相互比较——SciPy的参数与sklearn的参数并不完全匹配:例如,sklearn的默认初始化次数为n=10,而在SciPy中则不明确。使用100个质心作为两个参数和其他参数的默认值,SciPy速度更快,但这并不意味着更好。禁用所有附加参数
n_init=1
tol=thresh=0
max_iter=iter=100000
(您想要的是最终结果,而不是临时结果)。使用大型数据集。