Java 有没有办法让solr返回一个突出显示查询匹配项的pdf?

Java 有没有办法让solr返回一个突出显示查询匹配项的pdf?,java,pdf,solr,solrj,Java,Pdf,Solr,Solrj,我使用solrJ搜索我在solr中索引并存储在mongoDB中的PDF 所有内容都被正确地索引了,我能够得到一个html响应,并按照预期突出显示查询匹配项,但格式很奇怪,从pdf转换为文本时会产生大量垃圾字符 有什么方法可以让solr只给我一份带有突出显示的pdf吗?没有,没有内置的方法可以让solr返回一份pdf,并将pdf更改为突出显示匹配的部分。我担心可能是这样。您是否知道一种不需要任何非免费(供企业使用)库的方法?我猜您必须自己这样做,以某种方式将文档中的每个单词及其相关坐标提取和索引为

我使用solrJ搜索我在solr中索引并存储在mongoDB中的PDF

所有内容都被正确地索引了,我能够得到一个html响应,并按照预期突出显示查询匹配项,但格式很奇怪,从pdf转换为文本时会产生大量垃圾字符


有什么方法可以让solr只给我一份带有突出显示的pdf吗?

没有,没有内置的方法可以让solr返回一份pdf,并将pdf更改为突出显示匹配的部分。

我担心可能是这样。您是否知道一种不需要任何非免费(供企业使用)库的方法?我猜您必须自己这样做,以某种方式将文档中的每个单词及其相关坐标提取和索引为有效负载或元数据,然后使用PDF库添加突出显示框。