Java 使用cTAKES解析临床文档

Java 使用cTAKES解析临床文档,java,uima,ctakes,Java,Uima,Ctakes,我正试图找出如何运行临床文档管道 来自Java。我有一套明文形式的临床文件。我想解析这些文档并提取文档doc_ID中的文档列表,这里有频率为freq的CUI。我花了几天时间安装CTAKE并寻找解决方案。我将其缩小到ClinicalPipelineWithUmls.java,在其中获得一个测试并使用AnaylisEngineDescription运行SimplePleine。以下是代码的一部分: String documentText = "Text of document to test goe

我正试图找出如何运行临床文档管道 来自Java。我有一套明文形式的临床文件。我想解析这些文档并提取文档doc_ID中的文档列表,这里有频率为freq的CUI。我花了几天时间安装CTAKE并寻找解决方案。我将其缩小到ClinicalPipelineWithUmls.java,在其中获得一个测试并使用AnaylisEngineDescription运行SimplePleine。以下是代码的一部分:

String documentText = "Text of document to test goes here, such as the following. No edema, some soreness, denies pain.";
InputStream inStream = InputStreamCollectionReader.convertToByteArrayInputStream(documentText);
CollectionReader collectionReader = InputStreamCollectionReader.getCollectionReader(inStream);
AnalysisEngineDescription pipelineIncludingUmlsDictionaries = AnalysisEngineFactory.createAnalysisEngineDescription(
            "desc/analysis_engine/AggregatePlaintextUMLSProcessor");
AnalysisEngineDescription xWriter = AnalysisEngineFactory.createPrimitiveDescription(
            XWriter.class,
            XWriter.PARAM_OUTPUT_DIRECTORY_NAME,
            AssertionConst.evalOutputDir,
            XWriter.PARAM_XML_SCHEME_NAME,
            XWriter.XMI,
            XWriter.PARAM_FILE_NAMER_CLASS_NAME,
            CtakesFileNamer.class.getName());
SimplePipeline.runPipeline(collectionReader, pipelineIncludingUmlsDictionaries, xWriter);
System.out.println("Done at " + new Date());
问题是它找不到“InputStreamCollectionReader”。我找过了,但至今没有成功!你能给我一个提示或指一些方向吗?
谢谢你的帮助

您想使用
InputStreamCollectionReader
有什么特殊原因吗?另外,还有一些关于如何使用TextReader的示例。

我们为cTAKES实现了一个REST服务,它使我们能够将临床文本作为请求发送,并将分析的输出作为JSON响应返回


您可以在以下内容中查看cTAKES REST模块。我觉得这应该是对web访问感兴趣的cTAKES用户的方式。

感谢您的回复。是的,我正在使用cTAKES提取与每个单词相关的UMLS CUI(概念唯一标识符)。我在cTAKES文档中找到了这段代码。但是,找不到“InputStreamCollectionReader”。我对这个马文和Eclips的世界还不熟悉。对不起,如果这是一个愚蠢的问题!非常感谢您的评论和提示。好的,您是否尝试过使用
TextReader
?它应该适合你。cTAKES有自己的API文档吗?@matanster-checkout-readmeWas询问cTAKESitself@matanster什么样的文件才是准确的?