Java 是否存在不以完全解析为目标的选区解析器?

Java 是否存在不以完全解析为目标的选区解析器?,java,python,parsing,nlp,nltk,Java,Python,Parsing,Nlp,Nltk,我目前正在处理一组报告样式的文档,我想提取其中的信息。目前,我正在尝试将文本主体划分为更小的部分,以便进行单独分类(我们希望在短语中包含什么样的信息)。由于编写报告的语法不准确,标准的选区解析器无法为这些句子找到共同的词根。这显然需要依赖解析。然而,我很感兴趣的是,是否会有选区解析器不以完整的句子解析为目标。概率CKY的一行,它试图返回最可能的子节点。我目前正在使用Python nltk框架,但Java解决方案也可以。听起来像是在寻找“浅层解析”或“分块”。chunker可能只是在你的文本中识别

我目前正在处理一组报告样式的文档,我想提取其中的信息。目前,我正在尝试将文本主体划分为更小的部分,以便进行单独分类(我们希望在短语中包含什么样的信息)。由于编写报告的语法不准确,标准的选区解析器无法为这些句子找到共同的词根。这显然需要依赖解析。然而,我很感兴趣的是,是否会有选区解析器不以完整的句子解析为目标。概率CKY的一行,它试图返回最可能的子节点。我目前正在使用Python nltk框架,但Java解决方案也可以。

听起来像是在寻找“浅层解析”或“分块”。chunker可能只是在你的文本中识别NPs,或者只是识别NPs和VP,等等。我不相信nltk提供了一个现成的,但训练你自己的是非常容易的。nltk书的第三部分提供了关于如何创建或训练各种类型的块的详细说明。如果你想要一点层次结构,区块甚至可以嵌套。

听起来你在寻找“浅层解析”或“区块”。chunker可能只是在你的文本中识别NPs,或者只是识别NPs和VP,等等。我不相信nltk提供了一个现成的,但训练你自己的是非常容易的。nltk书的第三部分提供了关于如何创建或训练各种类型的块的详细说明。如果您需要一点层次结构,这些块甚至可以嵌套