Python 使用CRF模型(CRFSuite)标记项目时处理缺失或未知的特征
我正在使用CRFSuite(python的CRFSuite实现)来构建一个命名实体提取器,类似于上的教程 训练输入是一个单词序列,每个单词都有许多特征 问题是,对于我的特定用例,我并不总是具有我试图识别的实体的特征。我希望CRF模型能够根据周围单词的特征识别实体。然而,当我简单地输入一个空的dict{}作为单词的特征时,命名的实体永远不会被正确地分类Python 使用CRF模型(CRFSuite)标记项目时处理缺失或未知的特征,python,missing-data,crf,missing-features,Python,Missing Data,Crf,Missing Features,我正在使用CRFSuite(python的CRFSuite实现)来构建一个命名实体提取器,类似于上的教程 训练输入是一个单词序列,每个单词都有许多特征 问题是,对于我的特定用例,我并不总是具有我试图识别的实体的特征。我希望CRF模型能够根据周围单词的特征识别实体。然而,当我简单地输入一个空的dict{}作为单词的特征时,命名的实体永远不会被正确地分类 我想知道是否有一种功能或标准方法来处理这样的情况,即在训练模型后,并不总是所有项目都有功能。在某些情况下,为缺少的功能(如-或+)指定固定值可能很
我想知道是否有一种功能或标准方法来处理这样的情况,即在训练模型后,并不总是所有项目都有功能。在某些情况下,为缺少的功能(如-或+)指定固定值可能很有用