Parameters minpts=4是否是使用DBSCAN算法进行聚类的任何数据集的最佳设置?

Parameters minpts=4是否是使用DBSCAN算法进行聚类的任何数据集的最佳设置?,parameters,cluster-analysis,dbscan,Parameters,Cluster Analysis,Dbscan,关于DBSCAN“”的文章解释说,对于使用DBSCAN对数据点进行聚类的任何数据集,minpts值必须为4。它能为任何每股收益值提供最佳结果吗?没有“总是最好”这样的东西。作者建议先试试这个值。这并不意味着你有时不应该尝试其他价值观。我通常从minpts=10开始 另外,你还需要改变ε。正确选择epsilon可能比选择minpts更重要。这两个参数不是独立的。增加minpts可能意味着您需要 增加ε,反之亦然。没有“总是最好”这回事。作者建议先试试这个值。这并不意味着你有时不应该尝试其他价值观。

关于DBSCAN“”的文章解释说,对于使用DBSCAN对数据点进行聚类的任何数据集,minpts值必须为4。它能为任何每股收益值提供最佳结果吗?

没有“总是最好”这样的东西。作者建议先试试这个值。这并不意味着你有时不应该尝试其他价值观。我通常从minpts=10开始

另外,你还需要改变ε。正确选择epsilon可能比选择minpts更重要。这两个参数不是独立的。增加minpts可能意味着您需要 增加ε,反之亦然。

没有“总是最好”这回事。作者建议先试试这个值。这并不意味着你有时不应该尝试其他价值观。我通常从minpts=10开始

另外,你还需要改变ε。正确选择epsilon可能比选择minpts更重要。这两个参数不是独立的。增加minpts可能意味着您需要
在以后的工作中,作者建议使用minPts=2*dim作为默认值

J.桑德、M.埃斯特、H.-p.克里格尔和X.徐。1998。
空间数据库中基于密度的聚类:
算法GDBSCAN及其应用。

《数据挖掘与知识发现》2,2(1998),169–194。

如果有重复项,请使用较大的值: “我们的实验表明,该值适用于每个点只出现一次的数据库D,即,如果D实际上是一组点。”

较小的值通常计算效率较高。因此,保持minPts小,但不要太小


总是研究你的结果。在以后的工作中,作者建议默认使用minPts=2*dim

J.桑德、M.埃斯特、H.-p.克里格尔和X.徐。1998。
空间数据库中基于密度的聚类:
算法GDBSCAN及其应用。

《数据挖掘与知识发现》2,2(1998),169–194。

如果有重复项,请使用较大的值: “我们的实验表明,该值适用于每个点只出现一次的数据库D,即,如果D实际上是一组点。”

较小的值通常计算效率较高。因此,保持minPts小,但不要太小


总是研究你的结果。未经仔细检查,切勿使用它。

通常,minpts值应>=d+1,其中d是数据点的维度。一般来说,它被认为是minpts=2*d,正如埃里希·舒伯特在第一个答案中提到的

但也有一些情况,比如当您知道数据集包含大量噪声/异常值时,建议将minpts的值设置为较大值


有时,为了获得minpts的值,您可能必须咨询领域专家

通常,minpts值应该>=d+1,其中d是数据点的维度。一般来说,它被认为是minpts=2*d,正如埃里希·舒伯特在第一个答案中提到的

但也有一些情况,比如当您知道数据集包含大量噪声/异常值时,建议将minpts的值设置为较大值

有时,为了获得minpts的值,您可能必须咨询领域专家