Stanford nlp 我可以在Stanford parser中选择pos.model吗?

Stanford nlp 我可以在Stanford parser中选择pos.model吗?,stanford-nlp,Stanford Nlp,我想在斯坦福解析器解析过程中使用gate-EN-twitter.model进行词性标记。命令行上有这样做的选项吗?比如twitter.model上的pos.model门?或者我必须先使用Stanford pos tagger with gate模型进行标记,然后将其输出作为解析器的输入 谢谢 如果我理解正确,您希望强制斯坦福解析器使用这个特定于Twitter的POS标记器生成的标记。这是绝对可能的,尽管斯坦福NLP关于这个确切模型的推特应该作为一个警告: 斯坦福NLP的推特,2014年4月13日

我想在斯坦福解析器解析过程中使用gate-EN-twitter.model进行词性标记。命令行上有这样做的选项吗?比如twitter.model上的pos.model门?或者我必须先使用Stanford pos tagger with gate模型进行标记,然后将其输出作为解析器的输入


谢谢

如果我理解正确,您希望强制斯坦福解析器使用这个特定于Twitter的POS标记器生成的标记。这是绝对可能的,尽管斯坦福NLP关于这个确切模型的推特应该作为一个警告:

斯坦福NLP的推特,2014年4月13日:

在社交媒体上使用CoreNLP?尝试GATE Twitter model(iff未解析…
-pos.model GATE EN Twitter.model
#nlproc

()

话虽如此,如果你真的想尝试,我们无法阻止你:)

在强制输入您自己的标签时存在一个问题。看

基本上,您有两个选项(有关详细信息,请参阅常见问题解答):

  • 如果从命令行调用解析器,可以预先标记文本文件,然后使用一些命令行选项提醒解析器文本已预先标记

  • 如果以编程方式解析,那么
    LexicalizedParser#parse
    方法将接受任何
    列表非常感谢!我使用twitie pos tagger并生成一些pos标记的输入,使用LexicalizedParser生成一个.tree文件(outputFormat为
    penn
    )。我想用
    java-mx5g-cp“stanford-parser-full-2014-10-31/*:”edu.stanford.nlp.trees.englishgrammaticstructure-treeFile output.tree-conllx>output\u conllx.txt
    生成一个conll格式的输出,但似乎找不到twitie生成的一些特定于twitter的pos标记,比如CD<代码>线程“main”java.lang.IllegalArgumentException中的异常:未使用CD-46中的类edu.stanford.nlp.trees.SemanticHeadFinder为CD定义头规则。。据我所知,CD是一个普通的宾州树状银行POS标签。谢谢。不知道为什么会出现错误。但我猜它对
    edu.stanford.nlp.trees.EnglishGrammaticStructure
    不起作用,因为twitie pos标记确实包含twitter的特定信息,比如hashtag的HT…对。这可能就是斯坦福大学NLP推特明确反对使用此进行解析的原因。