Java 如何从DKPro/UIMA中的句子中获取引理?
我正在尝试建立一个管道,它会产生柠檬化的句子。我知道如何得到所有句子或所有引理,但我不知道如何得到引理集合除以句子结尾。下面是一个代码段,其中缺少一个参数,标记为Java 如何从DKPro/UIMA中的句子中获取引理?,java,nlp,uima,dkpro-core,Java,Nlp,Uima,Dkpro Core,我正在尝试建立一个管道,它会产生柠檬化的句子。我知道如何得到所有句子或所有引理,但我不知道如何得到引理集合除以句子结尾。下面是一个代码段,其中缺少一个参数,标记为??: AnalysisEngine pipeline = createEngine(createEngineDescription( createEngineDescription(BreakIteratorSegmenter.class),
??
:
AnalysisEngine pipeline = createEngine(createEngineDescription(
createEngineDescription(BreakIteratorSegmenter.class),
createEngineDescription(StanfordLemmatizer.class),
createEngineDescription(StopWordRemover.class, StopWordRemover.PARAM_MODEL_LOCATION,
new String[]{"stopwords.txt"})));
JCas jcas = JCasFactory.createJCas();
jcas.setDocumentText ("Almost all energy on Earth comes from the Sun. Plants make food energy from sunlight.");
jcas.setDocumentLanguage("en");
pipeline.process (jcas);
for (Sentence s : select(jcas, Sentence.class)) {
out.println("");
for (Lemma l : select(??????, Lemma.class))
out.print(l.getValue() + " ");
}
我需要在这段代码中修改什么,这样它就可以在两行中打印两个输入句子的引理。给你:
for (Lemma l : JCasUtil.selectCovered(Lemma.class, s))
out.print(l.getValue() + " ");
披露:我正在处理Apache UIMA项目谢谢,但是我得到了
类型JCasUtil中的selectCovered(Class,AnnotationFS)方法不适用于参数(句子,类)
错误。抱歉,顺序错误-更新。首先是课堂,然后是封面注释。谢谢,现在可以了。顺便说一句,找到这种详细规范的最佳位置是什么?文档JCas在UIMA Core SDK文档中-所有UIMA Core文档都链接在这里:要读取文件,需要使用集合阅读器。DKPro Core有一个TextReader()-我目前不知道有epub阅读器。-另见: