Cluster computing 如何对具有多个属性的数据集使用DBSCAN聚类算法?

Cluster computing 如何对具有多个属性的数据集使用DBSCAN聚类算法?,cluster-computing,cluster-analysis,dbscan,gmm,Cluster Computing,Cluster Analysis,Dbscan,Gmm,我正在从事一个使用数据集的项目- . 我想根据数据集的各种属性(如举手、访问的资源、查看的公告等)对学生进行聚类(每个学生表示为索引)。 请建议我如何使用DBSCAN实现这一点,如果没有,请提出一些技术,通过这些技术我可以做到这一点。我是数据科学领域的新手 谢谢 我试着学习gmm和dbscan 我想在数据集上进行聚类。DBSCAN的任何标准实现都将支持多个属性 当属性具有非常不同的类型时,这主要取决于您决定如何度量相似性。欧几里德距离可能没有意义。但是没有“正确”的方法来做这些,而是由您决定如何

我正在从事一个使用数据集的项目- . 我想根据数据集的各种属性(如举手、访问的资源、查看的公告等)对学生进行聚类(每个学生表示为索引)。 请建议我如何使用DBSCAN实现这一点,如果没有,请提出一些技术,通过这些技术我可以做到这一点。我是数据科学领域的新手

谢谢

我试着学习gmm和dbscan


我想在数据集上进行聚类。

DBSCAN的任何标准实现都将支持多个属性


当属性具有非常不同的类型时,这主要取决于您决定如何度量相似性。欧几里德距离可能没有意义。但是没有“正确”的方法来做这些,而是由您决定如何对数据建模。不幸的是,在这个数据集上,它将是相当随意的,因为这些属性没有自然的比例。

嗨,谢谢你的回复,你能给我推荐一些具有多个属性的dbscan实现吗?我怀疑你能找到一个只允许单个属性的好实现。因为对于单变量数据,有更好的方法。你能说出一些更好的方法吗?我可以对我判断的属性值取平均值,然后使用dbscan进行聚类吗?