Parsing SyntaxNet的不区分大小写的POS(词性)标记器

Parsing SyntaxNet的不区分大小写的POS(词性)标记器,parsing,nlp,tensorflow,part-of-speech,syntaxnet,Parsing,Nlp,Tensorflow,Part Of Speech,Syntaxnet,我试过,Parsey McParseface,这是一个经过预先训练的词性标记器,它与Syntax Net一起提供,它在标记具有适当大小写的句子方面做得很好 我想标记所有小写的句子,比如:我在多伦多长大,然后解析它以识别命名实体,比如城市,在本例中,多伦多 我有几个问题: 是否有一个预先训练过的、不区分大小写的、我可以使用的SyntaxNet的POS标记器 我应该如何为SyntaxNet培训自己的不区分大小写的POS标记器 培训SyntaxNet POS标记器是否需要大量CPU/GPU电源,或者

我试过,
Parsey McParseface
,这是一个经过预先训练的词性标记器,它与Syntax Net一起提供,它在标记具有适当大小写的句子方面做得很好

我想标记所有小写的句子,比如:
我在多伦多长大
,然后解析它以识别命名实体,比如城市,在本例中,
多伦多

我有几个问题:

  • 是否有一个预先训练过的、不区分大小写的、我可以使用的SyntaxNet的POS标记器
  • 我应该如何为SyntaxNet培训自己的不区分大小写的POS标记器
  • 培训SyntaxNet POS标记器是否需要大量CPU/GPU电源,或者可以在亚马逊或类似服务上租用的常规服务器上完成
  • 谷歌用来训练Parsey McParseface的数据集是否可供公众使用

可以在他们的Github页面上看到。“随附的英语解析器Parsey McParseface是在Penn树库和OntNotes的标准语料库以及英语Web树库上进行培训的,但遗憾的是,这些不是免费提供的。”,您可以查看universal dependencies以获取更多源。我用这些语言训练了我的法语语法分析器,效果很好。我发现:这也很有帮助。对于训练时间,它总是取决于你使用的机器。有GPU支持的TensorFlow比传统的只有CPU的机器要快。我在没有GPU的情况下在4核机器上训练了我的。花了几个周末训练我的模型,结果很好。也取决于你的训练规模。