Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/jquery-ui/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java cTAKES解析器输出_Java_Ubuntu_Apache Tika_Ctakes - Fatal编程技术网

Java cTAKES解析器输出

Java cTAKES解析器输出,java,ubuntu,apache-tika,ctakes,Java,Ubuntu,Apache Tika,Ctakes,我试图理解通过cTAKES解析器生成的结果。我无法理解某些要点- cTAKES解析器通过TIKa应用程序调用 我们得到以下结果- ctakes:AnatomicalSiteMention: liver:77:82:C1278929,C0023884 ctakes:ProcedureMention: CT scan:24:31:C0040405,C0040405,C0040405,C0040405 ctakes:ProcedureMention: CT:24:26:C0009244,C000924

我试图理解通过cTAKES解析器生成的结果。我无法理解某些要点-

cTAKES解析器通过TIKa应用程序调用 我们得到以下结果-

ctakes:AnatomicalSiteMention: liver:77:82:C1278929,C0023884
ctakes:ProcedureMention: CT scan:24:31:C0040405,C0040405,C0040405,C0040405
ctakes:ProcedureMention: CT:24:26:C0009244,C0009244,C0040405,C0040405,C0009244,C0009244,C0040405,C0009244,C0009244,C0009244,C0040405
ctakes:ProcedureMention: scan:27:31:C0034606,C0034606,C0034606,C0034606,C0441633,C0034606,C0034606,C0034606,C0034606,C0034606,C0034606
ctakes:RomanNumeralAnnotation: did:47:50:
ctakes:SignSymptomMention: lesions:62:69:C0221198,C0221198
ctakes:schema: coveredText:start:end:ontologyConceptArr
resourceName: sample
解析后的文档包含-

该患者于4月份接受了CT扫描,未发现肝脏病变

我有以下问题-

  • 为什么UMLS id像在ctakes中一样重复:过程:扫描:27:31:C0009244、C0009244、C0040405、C0040405、C0009244、C0009244、C0040405、C0009244、C0009244、C0009244、C0040405?(cTAKES配置属性文件具有注释props=BEGIN、END、ONTOLOGY\u CONCEPT\u ARR)

  • 罗马式的注释表示什么

  • 在概念唯一标识符(如C0040405)中,这7个数字是否有任何含义。这些是如何产生的

  • 系统信息:

    ApacheTika 1.10

    ApacheCtakes 3.2.2