Search 基于任意类别和相似性度量的匹配

Search 基于任意类别和相似性度量的匹配,search,statistics,data-mining,similarity,metric,Search,Statistics,Data Mining,Similarity,Metric,我有具有特定属性的客户数据库和客户类型。属性的集合可能会有所不同(但它们确实来自有限的集合),当我看到一个具有未知类型和给定属性的新客户时,我想确定他/她属于哪种类型。例如,假设这些客户已经在DB中 Customer | Type | Attributes 1 A 44,32,5,'X' 2 A 3,32,66,'A' 3 B 6,32,'A', 'B' 4 C

我有具有特定属性的客户数据库和客户类型。属性的集合可能会有所不同(但它们确实来自有限的集合),当我看到一个具有未知类型和给定属性的新客户时,我想确定他/她属于哪种类型。例如,假设这些客户已经在DB中

Customer | Type | Attributes

1           A      44,32,5,'X'
2           A      3,32,66,'A'
3           B      6,32,'A', 'B'           
4           C      47,31,2,'H'           
5           C      14,32,2,'O'  
6           C      2,'C'  
7           A      44
当我收到一个具有属性的新客户时,例如3,32,2,我想确定该客户属于哪种类型,代码应该报告其匹配的置信度(百分比)

这里最好的方法是什么?某种统计方法,或者基于某种亲和矩阵的方法,或者推荐引擎风格的基于皮尔逊相关系数的方法?样本,伪代码将是最受欢迎的,但任何,所有的想法都是好的


谢谢,

解决这个问题的方法是使用朴素贝叶斯