使用Solr搜索外部文档,包括格式

使用Solr搜索外部文档,包括格式,solr,formatting,apache-tika,captions,Solr,Formatting,Apache Tika,Captions,我们使用Solr和Tika搜索外部数据,如PDF和文档。 然而,我们得到的只是原始文本,没有格式。 我们还希望获得格式和元数据,如标题和项目符号。 有什么办法得到它吗 谢谢,, MosheHi Moshe,如果您能够突出显示您已经尝试过的内容,那就太好了。我们尝试使用EmbeddedResourceHandler获取文档中的内部数据,但是没有成功。如果你有一些例子,那就太好了

我们使用Solr和Tika搜索外部数据,如PDF和文档。 然而,我们得到的只是原始文本,没有格式。 我们还希望获得格式和元数据,如标题和项目符号。 有什么办法得到它吗

谢谢,,
Moshe

Hi Moshe,如果您能够突出显示您已经尝试过的内容,那就太好了。我们尝试使用EmbeddedResourceHandler获取文档中的内部数据,但是没有成功。如果你有一些例子,那就太好了