在Java中将GrobidExtractor.properties传递给Tika?

在Java中将GrobidExtractor.properties传递给Tika?,java,apache-tika,Java,Apache Tika,我正在尝试编写一个Java应用程序,它使用JournalParser从期刊文章中提取作者、引文等。GrobidJournalParser的文档为命令行应用程序和TikaServer提供了说明。我需要指出Grobid运行在本地主机以外的其他地方:8080。我有一个GrobidExtractor.properties文件,在我的类路径上包含正确的URL,但似乎找不到它-我收到一个错误,因为它试图在localhost:8080上访问Grobid WARNING: Interceptor for

我正在尝试编写一个Java应用程序,它使用JournalParser从期刊文章中提取作者、引文等。GrobidJournalParser的文档为命令行应用程序和TikaServer提供了说明。我需要指出Grobid运行在本地主机以外的其他地方:8080。我有一个GrobidExtractor.properties文件,在我的类路径上包含正确的URL,但似乎找不到它-我收到一个错误,因为它试图在localhost:8080上访问Grobid

   WARNING: Interceptor for {http://localhost:8080/processHeaderDocument}WebClient has thrown exception, unwinding now
org.apache.cxf.interceptor.Fault: No message body writer has been found for class org.apache.cxf.jaxrs.ext.multipart.MultipartBody, ContentType: multipart/form-data
    at org.apache.cxf.jaxrs.client.WebClient$BodyWriter.doWriteBody(WebClient.java:1220)
有没有其他方法告诉蒂卡或记者在哪里可以找到格罗布?Javadocs在这方面没有帮助。

因为,如果您想将Tika配置为使用备用GROBID服务器,您可以使用名为
org/apache/Tika/parser/journal/GrobidExtractor.properties的文件进行配置

您只调用了自己的
grobiextractor.properties
,这就是它没有被提取的原因。需要完整路径

假设您使用的是Linux,使用的是Tika应用程序,并且当前目录中有GROBID属性,那么您需要使用以下内容来修复它:

mkdir -p org/apache/tika/parser/journal
mv GrobidExtractor.properties org/apache/tika/parser/journal/
java -classpath .:tika-app-1.13.jar org.apache.tika.cli.TikaCLI --metadata journal.pdf

谢谢,文档中没有明确完整的路径名要求。