Search 基于任意类别和相似性度量的匹配_Search_Statistics_Data Mining_Similarity_Metric

Search 基于任意类别和相似性度量的匹配

search statistics

Search 基于任意类别和相似性度量的匹配,search,statistics,data-mining,similarity,metric,Search,Statistics,Data Mining,Similarity,Metric,我有具有特定属性的客户数据库和客户类型。属性的集合可能会有所不同（但它们确实来自有限的集合），当我看到一个具有未知类型和给定属性的新客户时，我想确定他/她属于哪种类型。例如，假设这些客户已经在DB中 Customer | Type | Attributes 1 A 44,32,5,'X' 2 A 3,32,66,'A' 3 B 6,32,'A', 'B' 4 C

我有具有特定属性的客户数据库和客户类型。属性的集合可能会有所不同（但它们确实来自有限的集合），当我看到一个具有未知类型和给定属性的新客户时，我想确定他/她属于哪种类型。例如，假设这些客户已经在DB中

Customer | Type | Attributes

1           A      44,32,5,'X'
2           A      3,32,66,'A'
3           B      6,32,'A', 'B'           
4           C      47,31,2,'H'           
5           C      14,32,2,'O'  
6           C      2,'C'  
7           A      44

当我收到一个具有属性的新客户时，例如3,32,2，我想确定该客户属于哪种类型，代码应该报告其匹配的置信度（百分比）

这里最好的方法是什么？某种统计方法，或者基于某种亲和矩阵的方法，或者推荐引擎风格的基于皮尔逊相关系数的方法？样本，伪代码将是最受欢迎的，但任何，所有的想法都是好的

谢谢，

解决这个问题的方法是使用朴素贝叶斯