Eclipse 开始使用ApacheTika?

Eclipse 开始使用ApacheTika?,eclipse,apache,maven,apache-tika,Eclipse,Apache,Maven,Apache Tika,我想编写一个Java web爬虫程序,使用ApacheTika下载网页文本内容,但我是一个使用Apache项目的新手,我还没有找到一个明确的源代码来说明如何将Tika集成到程序中。从我从互联网上收集到的信息来看,我已经在命令行中使用Maven构建了Tika,但我不确定从这里开始在Java程序中使用Tika类(?)如解析器等。我正在使用Eclipse,如果这有什么不同的话——我也安装了用于Eclipse的Maven插件,但我不确定该如何使用它……我需要“导入…”行吗?请原谅我的“初学者”问题,但请

我想编写一个Java web爬虫程序,使用ApacheTika下载网页文本内容,但我是一个使用Apache项目的新手,我还没有找到一个明确的源代码来说明如何将Tika集成到程序中。从我从互联网上收集到的信息来看,我已经在命令行中使用Maven构建了Tika,但我不确定从这里开始在Java程序中使用Tika类(?)如解析器等。我正在使用Eclipse,如果这有什么不同的话——我也安装了用于Eclipse的Maven插件,但我不确定该如何使用它……我需要“导入…”行吗?请原谅我的“初学者”问题,但请提供准备使用Tika的分步指南。

首先,您需要通读,其中包括如何将Tika包含在您的项目中。(这假设您对将第三方JAR包含到您自己的项目中有一些基本知识,如果没有,您需要阅读一些关于这方面的教程)

在项目中开始使用Tika最简单的方法是。这提供了一个单独的类,可以用于检测、解析为纯文本字符串,以及通过读取器解析为xhtml,所有这些都来自各种源。所有的基础都在那里


对于更高级的使用,您需要遵循和上提供的信息。你也可以遵循,它应该做你可能想做的事情,否则你会对如何开始有一个好的想法

首先,您需要通读,其中包括如何将Tika包含在您的项目中。(这假设您对将第三方JAR包含到您自己的项目中有一些基本知识,如果没有,您需要阅读一些关于这方面的教程)

在项目中开始使用Tika最简单的方法是。这提供了一个单独的类,可以用于检测、解析为纯文本字符串,以及通过读取器解析为xhtml,所有这些都来自各种源。所有的基础都在那里

对于更高级的使用,您需要遵循和上提供的信息。你也可以遵循,它应该做你可能想做的事情,否则你会对如何开始有一个好的想法