Cluster computing 如何对具有多个属性的数据集使用DBSCAN聚类算法？_Cluster Computing_Cluster Analysis_Dbscan_Gmm

Cluster computing 如何对具有多个属性的数据集使用DBSCAN聚类算法？

cluster-computing

Cluster computing 如何对具有多个属性的数据集使用DBSCAN聚类算法？,cluster-computing,cluster-analysis,dbscan,gmm,Cluster Computing,Cluster Analysis,Dbscan,Gmm,我正在从事一个使用数据集的项目- . 我想根据数据集的各种属性（如举手、访问的资源、查看的公告等）对学生进行聚类（每个学生表示为索引）。请建议我如何使用DBSCAN实现这一点，如果没有，请提出一些技术，通过这些技术我可以做到这一点。我是数据科学领域的新手谢谢我试着学习gmm和dbscan 我想在数据集上进行聚类。DBSCAN的任何标准实现都将支持多个属性当属性具有非常不同的类型时，这主要取决于您决定如何度量相似性。欧几里德距离可能没有意义。但是没有“正确”的方法来做这些，而是由您决定如何

我正在从事一个使用数据集的项目- . 我想根据数据集的各种属性（如举手、访问的资源、查看的公告等）对学生进行聚类（每个学生表示为索引）。请建议我如何使用DBSCAN实现这一点，如果没有，请提出一些技术，通过这些技术我可以做到这一点。我是数据科学领域的新手

谢谢

我试着学习gmm和dbscan

我想在数据集上进行聚类。

DBSCAN的任何标准实现都将支持多个属性

当属性具有非常不同的类型时，这主要取决于您决定如何度量相似性。欧几里德距离可能没有意义。但是没有“正确”的方法来做这些，而是由您决定如何对数据建模。不幸的是，在这个数据集上，它将是相当随意的，因为这些属性没有自然的比例。

嗨，谢谢你的回复，你能给我推荐一些具有多个属性的dbscan实现吗？我怀疑你能找到一个只允许单个属性的好实现。因为对于单变量数据，有更好的方法。你能说出一些更好的方法吗？我可以对我判断的属性值取平均值，然后使用dbscan进行聚类吗？