Nlp NER的线性CRF与Word2Vec

Nlp NER的线性CRF与Word2Vec,nlp,named-entity-recognition,Nlp,Named Entity Recognition,我读了很多关于线性CRF和Word2Vec的书,想知道哪一个是最好的命名实体识别。我使用斯坦福NER(一种线性CRF实现)训练了我的模型,获得了85%的精度。我知道Word2vec将相似的单词组合在一起,但这是一个很好的模式吗?CRF和Word2vec是苹果和桔子,所以比较它们真的没有意义 CRF用于序列标签问题,如NER。给定一个项目序列,表示为特征并与标签配对,他们将学习一个模型来预测新序列的标签 Word2vec的字嵌入是将字表示为浮点数的向量。他们自己不会预测任何事情。您甚至可以使用单词

我读了很多关于线性CRF和Word2Vec的书,想知道哪一个是最好的命名实体识别。我使用斯坦福NER(一种线性CRF实现)训练了我的模型,获得了85%的精度。我知道Word2vec将相似的单词组合在一起,但这是一个很好的模式吗?

CRF和Word2vec是苹果和桔子,所以比较它们真的没有意义

CRF用于序列标签问题,如NER。给定一个项目序列,表示为特征并与标签配对,他们将学习一个模型来预测新序列的标签

Word2vec的字嵌入是将字表示为浮点数的向量。他们自己不会预测任何事情。您甚至可以使用单词向量来构建CRF中的特征,尽管更典型的是将它们用于像LSTM这样的神经模型

有些人成功地将单词向量与CRF结合使用。有关在CRF中使用词向量的一些讨论,请参见和

请注意,对于许多标准的CRF实现,功能应该是二进制的或分类的,而不是连续的,因此您通常不能像其他功能那样只插入单词向量


如果你想知道哪一个更适合你的用例,唯一的办法就是两者都试一下。

对于典型的NER任务,线性CRF是一种流行的方法,而Word2Vec是一种可以用来提高CRF系统性能的功能

在2014年()中,作者比较了在基于CRF的NER系统中整合Word2Vec输出的多种方式,包括密集嵌入组合嵌入集群嵌入,以及一种新的原型方法


我在我的领域特定的NER项目中实现了原型思想,它对我来说非常有效

这很有道理!