Java 为了将html解析为字符串,我使用了tika解析器,但我遇到了一些问题,比如库和jdeveloper中的错误

Java 为了将html解析为字符串,我使用了tika解析器,但我遇到了一些问题,比如库和jdeveloper中的错误,java,html,apache,apache-tika,Java,Html,Apache,Apache Tika,首先,我必须下载tika-bundle-0.9.jar,但我找不到它。 第二,我写了这些 try { URL itemURL = new URL(""); DataInputStream daHTMLfromDaItem = new DataInputStream(itemURL.openStream()); Tika tika = new Tika(); Metadata metadata = new Metadata();

首先,我必须下载tika-bundle-0.9.jar,但我找不到它。 第二,我写了这些

 try {
        URL itemURL = new URL("");
        DataInputStream daHTMLfromDaItem = new DataInputStream(itemURL.openStream());
        Tika tika = new Tika();
        Metadata metadata = new Metadata();
        Reader reader = tika.parse(daHTMLfromDaItem, metadata);

          String s=reader.toString();
          //System.out.print(s);


    } catch (Exception e) {
        e.printStackTrace();
    }
错误

Error(5,24): cannot access class org.apache.tika.Tika; class file has wrong version 49.0, should be 45.3 or 46.0 or 47.0 or 48.0

Error(6,33): cannot access class org.apache.tika.metadata.Metadata; class file has wrong version 49.0, should be 45.3 or 46.0 or 47.0 or 48.0

Error(15,13): class Tika not found in class mypackage.TikaParsing

Error(15,29): class Tika not found in class mypackage.TikaParsing

Error(16,13): class Metadata not found in class mypackage.TikaParsing

Error(16,37): class Metadata not found in class mypackage.TikaParsing
另外,我必须说,除了tika-bundle-0.9.jar之外,我添加了所有必要的库。tika-bundle-0.9.jar是否会出现一些问题?如何找到tika-bundle-0.9.jar?我找不到解决办法


谢谢

tika库是用Java 1.5编译的,但是您尝试在Java 1.4环境中运行它们。这就是第一条错误消息告诉我们的。版本
49.0
由Java1.5生成,版本
48.0
由Java1.4.x生成


可以使用Java 1.5+运行应用程序,也可以尝试查找与Java 1.4.2兼容的旧版本tika。tika捆绑包可从Maven获得。如果您使用的是maven,请添加如下内容:

<dependencies>
 <dependency>
   <groupId>org.apache.tika</groupId>
   <artifactId>tika-bundle</artifactId>
   <version>0.9</version>
   <scope>provided</scope>
 </dependency>
<dependencies>

org.apache.tika
(每个版本都在其自己的子目录中)