Java 如何在文件列表上运行UIMA?

Java 如何在文件列表上运行UIMA?,java,uima,Java,Uima,我在Java程序中使用org.apache.uima.examples.cpe.simplerunpe,该程序将CPEScription XML文件作为输入 这个文件有一个InputDirectory的nameValuePair,它指向UIMA应该处理的文本文件的位置 如何在指定的文件列表上运行CPE 背景是我在一个目录中有大量的文本文件可以运行UIMA来生成CAS文件。 如果在运行几天后,UIMA进程突然停止(由于堆内存不足或计算机必须重新启动而崩溃),我只希望在剩余的未处理文件上运行该进程

我在Java程序中使用org.apache.uima.examples.cpe.simplerunpe,该程序将CPEScription XML文件作为输入

这个文件有一个InputDirectory的nameValuePair,它指向UIMA应该处理的文本文件的位置

如何在指定的文件列表上运行CPE

背景是我在一个目录中有大量的文本文件可以运行UIMA来生成CAS文件。 如果在运行几天后,UIMA进程突然停止(由于堆内存不足或计算机必须重新启动而崩溃),我只希望在剩余的未处理文件上运行该进程


我该怎么做呢?

在您的CpeDescription XML文件中,您需要修改CollectionReader以接受一个新参数(例如文件列表或正则表达式),以过滤掉已经处理过的文件。让你开始

另一种解决方法是将大型InputDirectory构造成更小的子目录,并在每个子目录上运行UIMA CPE。这样,如果一个CPE批处理失败,您可以重新启动它