Machine learning CRF套件预测的置信水平

Machine learning CRF套件预测的置信水平,machine-learning,nltk,Machine Learning,Nltk,我在这里使用CRFSuite包 我已经成功地使用它来构建分类器和标记文本。然而,我想知道我是否能得到它做出的每一个预测的置信值 似乎不是这样。我真正想要的是得到一个单词作为每种类型的标记(“PER”、“LOC”、“MISC”等)的概率,而不仅仅是预测本身。API提供了提取条件概率。我猜你是说crfsuite二进制文件没有这个选项。您可以编辑源代码并自己添加选项我希望这可以作为一个答案。Sklearn crfsuite为每个标签提供概率 predict_marginals(X) Make a p

我在这里使用CRFSuite包

我已经成功地使用它来构建分类器和标记文本。然而,我想知道我是否能得到它做出的每一个预测的置信值


似乎不是这样。我真正想要的是得到一个单词作为每种类型的标记(“PER”、“LOC”、“MISC”等)的概率,而不仅仅是预测本身。

API提供了提取条件概率。我猜你是说crfsuite二进制文件没有这个选项。您可以编辑源代码并自己添加选项

我希望这可以作为一个答案。Sklearn crfsuite为每个标签提供概率

predict_marginals(X)
Make a prediction.

Parameters: X (list of lists of dicts) – feature dicts in python-crfsuite format
Returns:    y – predicted probabilities for each label at each position
Return type:    list of lists of dicts

资料来源:

关于如何做到这一点,有什么具体步骤吗?API列出了方法。您需要迭代所有可能的标签并提取概率。或者只使用python接口。使用它进行原型制作和工作要容易得多。您已经知道如何从crfsuite获得标签的置信度分数了吗?