Solr 在远程glassfish上解析(使用Tika)
我正在使用Tika解析器将我的文件索引到Solr中。我创建了自己的解析器(它扩展了XMLParser)。它使用我自己的mimetype。 我创建了一个jar文件,其内部如下所示:Solr 在远程glassfish上解析(使用Tika),solr,glassfish,apache-tika,Solr,Glassfish,Apache Tika,我正在使用Tika解析器将我的文件索引到Solr中。我创建了自己的解析器(它扩展了XMLParser)。它使用我自己的mimetype。 我创建了一个jar文件,其内部如下所示: src |-main |-some_packages |-MyParser.java |resources |-META-INF |-services |-org.apache.tika.parser.Parser
src
|-main
|-some_packages
|-MyParser.java
|resources
|-META-INF
|-services
|-org.apache.tika.parser.Parser (which contains a line:some_packages.MyParser.java)
|_org
|-apache
|-tika
|-mime
|-custom-mimetypes.xml
在自定义mimetype中,我使用了新mimetype的定义,因为我的xml文件有一些特殊的标记
现在问题出在哪里了:我已经在本地机器上安装的glassfish上用Solr测试了解析和索引。效果很好。然后我想把它安装在某个远程服务器上。安装了相同版本的glassfish(3.1.1)。我复制了粘贴的Solr应用程序,它是包含所有库的主目录(包括tika jar和带有自定义解析器的jar)。不幸的是,它不起作用。将文件发布到Solr后,我可以在内容类型字段中看到它检测到我的自定义mime类型。但并没有任何字段像MyParser类从未运行过那个样假定存在。我得到的唯一字段是都柏林核心区的字段。我检查(通过简单地添加一些打印行)Tika只使用XMLParser。
有没有人有过类似的问题?如何处理这个问题?问题是我使用Java 7编译解析器,但Apache Tika是使用Java 5编译的 已解决:)原来问题是使用Java 7…您可能希望添加该选项作为答案