Nlp LDA的混淆矩阵
我试图使用混淆矩阵检查我的LDA模型的性能,但我不知道该怎么做。我希望有人能给我指出正确的方向 所以我在一个充满简短文档的语料库上运行了一个LDA模型。然后我计算每个文档的平均向量,然后继续计算余弦相似度Nlp LDA的混淆矩阵,nlp,lda,topic-modeling,confusion-matrix,topicmodels,Nlp,Lda,Topic Modeling,Confusion Matrix,Topicmodels,我试图使用混淆矩阵检查我的LDA模型的性能,但我不知道该怎么做。我希望有人能给我指出正确的方向 所以我在一个充满简短文档的语料库上运行了一个LDA模型。然后我计算每个文档的平均向量,然后继续计算余弦相似度 我现在如何获得混淆矩阵?请注意,我对NLP的世界非常陌生。如果有其他/更好的方法来检查此型号的性能,请告诉我。您的型号应该做什么?它是如何可测试的 在您的问题中,您没有描述您对模型的可测试评估,其结果将在混淆矩阵中表示 混淆矩阵可帮助您表示和探索预测系统(如分类器)的不同类型的“准确性”。它要
我现在如何获得混淆矩阵?请注意,我对NLP的世界非常陌生。如果有其他/更好的方法来检查此型号的性能,请告诉我。您的型号应该做什么?它是如何可测试的 在您的问题中,您没有描述您对模型的可测试评估,其结果将在混淆矩阵中表示 混淆矩阵可帮助您表示和探索预测系统(如分类器)的不同类型的“准确性”。它要求您的系统做出选择(例如是/否或多标签分类器),并且您必须使用已知的测试数据,以便能够根据系统应如何选择对其进行评分。然后将矩阵中的这些结果计算为可能性组合之一,例如,对于二进制选择,有两个错误和两个正确 例如,如果您的余弦相似度试图预测一个文档是否与另一个文档属于同一“类别”,并且您确实知道真正的答案,那么您可以对所有文档进行评分,以确定它们的预测是正确的还是错误的 二进制选择的四种可能性是:
- 灵敏度、d’(dee prime)、召回率、命中率或真阳性率(TPR)
- 特异性、选择性或真阴性率(TNR)
- 精确度或阳性预测值(PPV)
- 负预测值(NPV)
- 漏检率或假阴性率(FNR)
- 脱落或假阳性率(FPR)
- 错误发现率(FDR)
- 漏报率(适用于)
- 准确度
- F分数