Java 斯坦福NLP输出格式

Java 斯坦福NLP输出格式,java,python,stanford-nlp,Java,Python,Stanford Nlp,使用斯坦福NLP,我想让我的文本经过引理化和共指消解 比如input.txt:“斯坦福大学位于加利福尼亚州。它是一所伟大的大学,创建于1891年。” 我希望output.txt:“斯坦福大学位于加利福尼亚州。斯坦福大学是一所伟大的大学,建于1891年。” 我还希望得到一个表,其中第一列由文本中识别的名称实体组成,第二列是它们被标识为的名称类。因此,对于上面的示例句子,它类似于: 第1列第2列 斯坦福大学地点、组织 加州位置 因此,在表中,名称实体只出现一次 我在网上找不到任何关于使用NLP操作默

使用斯坦福NLP,我想让我的文本经过引理化和共指消解

比如input.txt:“斯坦福大学位于加利福尼亚州。它是一所伟大的大学,创建于1891年。” 我希望output.txt:“斯坦福大学位于加利福尼亚州。斯坦福大学是一所伟大的大学,建于1891年。”

我还希望得到一个表,其中第一列由文本中识别的名称实体组成,第二列是它们被标识为的名称类。因此,对于上面的示例句子,它类似于:

第1列第2列 斯坦福大学地点、组织 加州位置

因此,在表中,名称实体只出现一次


我在网上找不到任何关于使用NLP操作默认xml输出或直接更改输入文本文件的信息。你能给我一些建议吗?

如果你使用命令行,你可以使用
-outputFormat text
获得一个可读的版本,或者使用
-outputFormat json
获得一个
json
版本。在Java代码中,可以使用
edu.StanfordCoreNLP.nlp.pipeline.StanfordCoreNLP.prettyPrint()
edu.StanfordCoreNLP.nlp.pipeline.StanfordCoreNLP.jsonPrint()
打印注释。

为吸引更多人关注您的问题,使用Java标记也会非常有用。您还应该阅读本指南,因为您的问题的措辞几乎是要求社区为您编写代码(这并不是如此)