Matrix 贝叶斯网络的混淆矩阵
我试图理解贝叶斯网络。我有一个有10个属性的数据文件,我想获取这个数据表的混淆表,我想我需要计算所有字段的tp,fp,fn,tn。这是真的吗?如果这是我需要为贝叶斯网络做的Matrix 贝叶斯网络的混淆矩阵,matrix,probability,data-mining,bayesian-networks,Matrix,Probability,Data Mining,Bayesian Networks,我试图理解贝叶斯网络。我有一个有10个属性的数据文件,我想获取这个数据表的混淆表,我想我需要计算所有字段的tp,fp,fn,tn。这是真的吗?如果这是我需要为贝叶斯网络做的 真的需要一些指导,我迷路了 用于评估分类器的性能,任何分类器 过程通常如下: 您有一些已标记的数据实例 你想用它来训练一个 分类器,使其能够进行预测 新的未标记实例的类 使用分类器 选择(神经网络,贝叶斯 net、SVM等)我们构建了一个 使用您的培训数据进行建模 作为输入 在这一点上,您通常会 评估系统的性能 在部署之前
真的需要一些指导,我迷路了 用于评估分类器的性能,任何分类器 过程通常如下:
- 您有一些已标记的数据实例 你想用它来训练一个 分类器,使其能够进行预测 新的未标记实例的类
- 使用分类器 选择(神经网络,贝叶斯 net、SVM等)我们构建了一个 使用您的培训数据进行建模 作为输入
- 在这一点上,您通常会 评估系统的性能 在部署之前对其进行建模。所以使用 以前未使用的数据子集 (测试集),我们比较了模型 这些实例的分类 与实际班级的情况相反。A. 总结这些结果的好方法 是由一个混乱矩阵显示的 每一类实例是如何 预测
对于二进制分类任务,约定是将一个类指定为正,另一个类指定为负。因此,根据混淆矩阵,正确分类为阳性的阳性实例的百分比称为真阳性(TP)率。其他定义遵循相同的约定…您要问的是一个包含两个以上类的混淆矩阵。 以下是您的操作步骤:
- 为每个类构建一个分类器,其中训练集包括 类中的文档集(正片标签)及其 补语(否定标签)
- 给出测试文档,分别应用每个分类器
- 将文档分配给得分最高的类 最大置信值,或最大概率
Picca, Davide, Benoît Curdy, and François Bavaud.2006.Non-linear correspondence analysis in text retrieval: A kernel view. In Proc. JADT.
我很难理解这个问题。您的贝叶斯网络执行什么任务?这是分类吗?如果是这样,分类是什么,它是数据文件中的属性之一吗?更多的信息将使这个问题更容易回答。