使用Solr单元格搜索索引PDF时没有结果

使用Solr单元格搜索索引PDF时没有结果,pdf,solr,solr-cell,Pdf,Solr,Solr Cell,我已经与Solr合作了一段时间,最近我尝试了Solr cell组件,我正在为一些PDF编制索引,但是我遇到了与中所述完全相同的问题 在管理控制台中搜索*:*时,会列出PDF。然而,当我在PDF中搜索内容时,我没有得到任何结果 我已经尝试了给出答案的命令,但没有成功,我仍然有相同的问题,我尝试了不同的Solr版本,我使用3.5 btw,不同的PDF,我更改了schema.xml中的字段,我修改了solrconfig.xml中的RequestHandler,但似乎没有任何效果。任何帮助都将不胜感激。

我已经与Solr合作了一段时间,最近我尝试了Solr cell组件,我正在为一些PDF编制索引,但是我遇到了与中所述完全相同的问题

在管理控制台中搜索*:*时,会列出PDF。然而,当我在PDF中搜索内容时,我没有得到任何结果


我已经尝试了给出答案的命令,但没有成功,我仍然有相同的问题,我尝试了不同的Solr版本,我使用3.5 btw,不同的PDF,我更改了schema.xml中的字段,我修改了solrconfig.xml中的RequestHandler,但似乎没有任何效果。任何帮助都将不胜感激。

我终于让它工作了。原来是fmap.content输入参数有问题。我没有直接在solrconfig.xml文件中的RequestHandler上声明它,而是在用于索引PDF文件的curl命令中传递它:

curl 'http://localhost:8080/solr/solrcell/update/extract?map.content=text&map.stream_name=id&commit=true' -F "file=@mccm.pdf"
我知道这种方法也应该有效,但正如你所看到的,有一个“地图”而不是“fmap” 我使用的是solr以前版本中的一个图书示例

我选择保留在solrconfig.xml文件中显式声明的fmap输入参数,以避免出现任何问题:

正文


感谢您的帮助。

请发布您的架构、用于索引的命令或代码以及查询。我已更改了schema.xml中的字段schema Solr附带的schema包含正确的Solr CEL字段。对于q=*:*,您可以在输出返回的字段中搜索吗?