如何根据点在Python中所属的函数对点进行聚类?

如何根据点在Python中所属的函数对点进行聚类?,python,scikit-learn,data-science,hierarchical-clustering,Python,Scikit Learn,Data Science,Hierarchical Clustering,抱歉,如果标题不明确。让我解释一下这个问题。顺便说一句,我对数据科学真的很陌生,如果我说的话毫无意义,我很抱歉 最近遇到了一个与集群相关的问题。给出了许多点的坐标。任务是将它们聚集在一起。但它不是基于距离的聚类类型。事实上,这些点属于函数,因此需要对它们进行聚类 这不是我的数据看起来的样子,但问题是相同的: 。在给定的链接中,所提供的问题是我所寻找的,但它是在R中,而不是在Python中。当我在Python中搜索“函数集群”时,我什么也找不到。如果您知道如何操作,请告诉我正确的路径。如果我理解

抱歉,如果标题不明确。让我解释一下这个问题。顺便说一句,我对数据科学真的很陌生,如果我说的话毫无意义,我很抱歉

最近遇到了一个与集群相关的问题。给出了许多点的坐标。任务是将它们聚集在一起。但它不是基于距离的聚类类型。事实上,这些点属于函数,因此需要对它们进行聚类

这不是我的数据看起来的样子,但问题是相同的:


。在给定的链接中,所提供的问题是我所寻找的,但它是在R中,而不是在Python中。当我在Python中搜索“函数集群”时,我什么也找不到。如果您知道如何操作,请告诉我正确的路径。

如果我理解正确,您正在尝试自动查找数据并执行线性回归。我认为一个可行的方法是从数据集中取样,这样每行平均看5个点,然后迭代解决方案的数量,以最小化平方误差之和。你必须非常确定你的数据是由离散数量的线性相关性组成的,而不是比这更复杂的任何东西。是和否。你正确理解了这个问题,但可能提供的图像让你认为它是线性的。但事实并非如此。我的数据集中的关系是非线性的:/你建议的关系越偏离非线性,你就越有可能发现似是而非的簇-我会谨慎地使用这种方法。你知道簇中的关系是什么吗?它总是日志吗?线性的组中沿函数的扩散常数是否?(对于非线性,这可能总是错误的)?如果是这样的话,我会擦干DBSCAN,因为它尊重的是传播,而不仅仅是距离。否则,如果您知道函数,我会在聚类之前对数据进行反向转换。DBSCAN:。Python中的DBSCAN:有几种集群技术可以捕获数据集的“本地结构”。如上所述,DBSCAN是一种流行的。其他几个你可以检查的是:带有单链接的层次聚集聚类和谱聚类。两者都存在于sklearn.cluster中。此链接比较了各种聚类算法对数据进行聚类的方式。