Design patterns 找到将一组变量与另一个变量DBSCAN进行转换的方法

Design patterns 找到将一组变量与另一个变量DBSCAN进行转换的方法,design-patterns,cluster-analysis,dbscan,Design Patterns,Cluster Analysis,Dbscan,我正在寻找一种方式/方法,如何将一组变量转换为另一个变量,以便使用DBSCAN算法的值 我的变量集称为兴趣,其中一个数据至少可以包含14个兴趣中的3个。 我的数据似乎有许多独特的兴趣集,当我试图将其转换为数字时,兴趣中的模式会被破坏,从而破坏集群本身 如何将数据兴趣转换为数字形式,而不会破坏兴趣中的模式?DBSCAN不需要数字数据 例如,您可以使用Jaccard索引来度量集合的相似性。假设我已经有了数字数据,那么我应该如何将其转换为DBSCAN需要的任何内容?DBSCAN需要一个相似性函数。一个

我正在寻找一种方式/方法,如何将一组变量转换为另一个变量,以便使用DBSCAN算法的值

我的变量集称为兴趣,其中一个数据至少可以包含14个兴趣中的3个。 我的数据似乎有许多独特的兴趣集,当我试图将其转换为数字时,兴趣中的模式会被破坏,从而破坏集群本身


如何将数据兴趣转换为数字形式,而不会破坏兴趣中的模式?

DBSCAN不需要数字数据


例如,您可以使用Jaccard索引来度量集合的相似性。

假设我已经有了数字数据,那么我应该如何将其转换为DBSCAN需要的任何内容?DBSCAN需要一个相似性函数。一个你足够理解的,可以选择Epsilon的。例如,我有地理数据。纬度和经度是数字。对于距离,我想使用大圆距离,我的应用程序的ε半径是10英里。不需要转换任何内容,但需要了解数据的相似性!。