如何根据点在Python中所属的函数对点进行聚类？_Python_Scikit Learn_Data Science_Hierarchical Clustering

如何根据点在Python中所属的函数对点进行聚类？

python scikit-learn

如何根据点在Python中所属的函数对点进行聚类？,python,scikit-learn,data-science,hierarchical-clustering,Python,Scikit Learn,Data Science,Hierarchical Clustering,抱歉，如果标题不明确。让我解释一下这个问题。顺便说一句，我对数据科学真的很陌生，如果我说的话毫无意义，我很抱歉最近遇到了一个与集群相关的问题。给出了许多点的坐标。任务是将它们聚集在一起。但它不是基于距离的聚类类型。事实上，这些点属于函数，因此需要对它们进行聚类这不是我的数据看起来的样子，但问题是相同的：。在给定的链接中，所提供的问题是我所寻找的，但它是在R中，而不是在Python中。当我在Python中搜索“函数集群”时，我什么也找不到。如果您知道如何操作，请告诉我正确的路径。如果我理解

抱歉，如果标题不明确。让我解释一下这个问题。顺便说一句，我对数据科学真的很陌生，如果我说的话毫无意义，我很抱歉

最近遇到了一个与集群相关的问题。给出了许多点的坐标。任务是将它们聚集在一起。但它不是基于距离的聚类类型。事实上，这些点属于函数，因此需要对它们进行聚类

这不是我的数据看起来的样子，但问题是相同的：

。在给定的链接中，所提供的问题是我所寻找的，但它是在R中，而不是在Python中。当我在Python中搜索“函数集群”时，我什么也找不到。如果您知道如何操作，请告诉我正确的路径。

如果我理解正确，您正在尝试自动查找数据并执行线性回归。我认为一个可行的方法是从数据集中取样，这样每行平均看5个点，然后迭代解决方案的数量，以最小化平方误差之和。你必须非常确定你的数据是由离散数量的线性相关性组成的，而不是比这更复杂的任何东西。是和否。你正确理解了这个问题，但可能提供的图像让你认为它是线性的。但事实并非如此。我的数据集中的关系是非线性的：/你建议的关系越偏离非线性，你就越有可能发现似是而非的簇-我会谨慎地使用这种方法。你知道簇中的关系是什么吗？它总是日志吗？线性的组中沿函数的扩散常数是否？（对于非线性，这可能总是错误的）？如果是这样的话，我会擦干DBSCAN，因为它尊重的是传播，而不仅仅是距离。否则，如果您知道函数，我会在聚类之前对数据进行反向转换。DBSCAN:。Python中的DBSCAN：有几种集群技术可以捕获数据集的“本地结构”。如上所述，DBSCAN是一种流行的。其他几个你可以检查的是：带有单链接的层次聚集聚类和谱聚类。两者都存在于sklearn.cluster中。此链接比较了各种聚类算法对数据进行聚类的方式。