Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/asp.net-core/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 从GATE数据存储中读取带注释的数据_Java_Gate - Fatal编程技术网

Java 从GATE数据存储中读取带注释的数据

Java 从GATE数据存储中读取带注释的数据,java,gate,Java,Gate,我使用GATE通过其包含的情感手动注释大量文本。为了进一步处理此文本,我喜欢将其从数据存储导出到我自己的Java应用程序中。我没有找到关于如何做到这一点的文档。我已经编写了一个程序将数据导入到数据存储中,但是我不知道如何从数据存储中获取带注释的数据。我还尝试使用Luke()打开基于lucene的数据存储。这是一个能够读取Lucene索引的工具。但无法使用该工具打开Gate Lucene数据存储:(有人知道如何从数据存储读取带注释的文本吗?您可以使用Gate API从数据存储加载文档,然后以正常方

我使用GATE通过其包含的情感手动注释大量文本。为了进一步处理此文本,我喜欢将其从数据存储导出到我自己的Java应用程序中。我没有找到关于如何做到这一点的文档。我已经编写了一个程序将数据导入到数据存储中,但是我不知道如何从数据存储中获取带注释的数据。我还尝试使用Luke()打开基于lucene的数据存储。这是一个能够读取Lucene索引的工具。但无法使用该工具打开Gate Lucene数据存储:(有人知道如何从数据存储读取带注释的文本吗?

您可以使用Gate API从数据存储加载文档,然后以正常方式将其导出为Gate XML(导入和异常处理省略):

如果要将注释作为内联XML编写,请将
DocumentStaxUtils.writeDocument
替换为

Set<String> types = new HashSet<String>();
types.add("Person");
types.add("Location"); // and whatever others you're interested in
FileUtils.write(outputFile, d.toXml(d.getAnnotations().get(types), true));
Set types=newhashset();
类型。添加(“人员”);
type.add(“Location”);//以及您感兴趣的其他内容
write(outputFile,d.toXml(d.getAnnotations().get(types),true));

(我使用是为了方便,但是你可以自己处理打开和关闭文件)。

酷!谢谢你的快速回答。我不得不将gate.creole.annic.SearchableDataStore更改为gate.persist.LuceneDataStoreImpl,但这取决于数据存储之前的保存方式
Set<String> types = new HashSet<String>();
types.add("Person");
types.add("Location"); // and whatever others you're interested in
FileUtils.write(outputFile, d.toXml(d.getAnnotations().get(types), true));