Java 如何将org.apache.tika源代码集成到我的项目中?
我已经下载了ApacheTika源文件夹,并安装了Maven。然后通过命令行(mvn安装),我安装了Tika:Java 如何将org.apache.tika源代码集成到我的项目中?,java,maven,apache-tika,Java,Maven,Apache Tika,我已经下载了ApacheTika源文件夹,并安装了Maven。然后通过命令行(mvn安装),我安装了Tika: [INFO] Reactor Summary: [INFO] ------------------------------------------------------------------------ [INFO] Apache Tika parent .................................... SUCCESS [4:20.656s] [INFO]
[INFO] Reactor Summary:
[INFO] ------------------------------------------------------------------------
[INFO] Apache Tika parent .................................... SUCCESS [4:20.656s]
[INFO] Apache Tika core ...................................... SUCCESS [2:26.466s]
[INFO] Apache Tika parsers ................................... SUCCESS [3:27.711s]
[INFO] Apache Tika application ............................... SUCCESS [1:23.548s]
[INFO] Apache Tika OSGi bundle ............................... SUCCESS [3:34.223s]
[INFO] Apache Tika ........................................... SUCCESS [6.217s]
[INFO] ------------------------------------------------------------------------
[INFO] ------------------------------------------------------------------------
[INFO] BUILD SUCCESSFUL
但现在我不知道在我的项目中使用Tika的下一步是什么。实际上,我不知道如何在我的项目中添加Tika
我使用Tika源代码而不是jar文件的原因是我想将farsi.ngp
文件添加到Tika的languageIdentification
。我已经添加了farsi.ngp
并由Maven构建了Tika,但现在我不知道下一步是什么。我必须为我的项目添加哪些内容?我阅读了第页,以下是我的建议:
修改代码或添加.ngp文件并生成代码后,必须获得以下生成构件:
tika-core/target/tika-core-1.0.jar
tika-parsers/target/tika-parsers-1.0.jar
在您的应用程序中,无论您希望在何处使用tika,都将2个tika jar及其依赖的jar分配到类路径。例如,如果在应用程序中使用ant,则将其添加到生成文件中:
<classpath>
... <!-- your other classpath entries -->
<pathelement location="path/to/tika-core-1.0.jar"/>
<pathelement location="path/to/tika-parsers-1.0.jar"/>
<pathelement location="path/to/commons-logging-1.1.1.jar"/>
<pathelement location="path/to/commons-compress-1.0.jar"/>
<pathelement location="path/to/pdfbox-1.0.0-incubating.jar"/>
<pathelement location="path/to/fontbox-1.0.0-incubator.jar"/>
<pathelement location="path/to/jempbox-1.0.0-incubator.jar"/>
<pathelement location="path/to/poi-3.6.jar"/>
<pathelement location="path/to/poi-scratchpad-3.6.jar"/>
<pathelement location="path/to/poi-ooxml-3.6.jar"/>
<pathelement location="path/to/poi-ooxml-schemas-3.6.jar"/>
<pathelement location="path/to/xmlbeans-2.3.0.jar"/>
<pathelement location="path/to/dom4j-1.6.1.jar"/>
<pathelement location="path/to/xml-apis-1.0.b2.jar"/>
<pathelement location="path/to/geronimo-stax-api_1.0_spec-1.0.jar"/>
<pathelement location="path/to/tagsoup-1.2.jar"/>
<pathelement location="path/to/asm-3.1.jar"/>
<pathelement location="path/to/log4j-1.2.14.jar"/>
<pathelement location="path/to/metadata-extractor-2.4.0-beta-1.jar"/>
</classpath>
...
希望这对您有所帮助。将其作为依赖项。但是用一些标识它为非标准构建的东西来标记它。更好的是,向Tika提交一个补丁,这样它就包含在一个发行版中了。这对Tika应用程序-*.jar也有效吗?说明建议从目录中调用
mvn install
,但jar不是目录。