Solr-Tika-解析内容以启用高亮显示

Solr-Tika-解析内容以启用高亮显示,solr,highlighting,apache-tika,Solr,Highlighting,Apache Tika,我的理解是,通过Solr为PDF、Word、Excel等文档编制索引将允许搜索,但不允许突出显示。我有以下代码来执行索引: String urlString = "http://localhost:8983/solr"; SolrServer solr = new HttpSolrServer(urlString); ContentStreamUpdateRequest up = new ContentStreamUpdateRequest("/

我的理解是,通过Solr为PDF、Word、Excel等文档编制索引将允许搜索,但不允许突出显示。我有以下代码来执行索引:

        String urlString = "http://localhost:8983/solr"; 
        SolrServer solr = new HttpSolrServer(urlString);
        ContentStreamUpdateRequest up = new ContentStreamUpdateRequest("/update/extract");

        for (MultipartFile file : files) {
            if (file.getOriginalFilename().equals("")) {
                continue;
            }
            File destFile = new File(destPath, file.getOriginalFilename());
            file.transferTo(destFile);
            up.addFile(destFile);

            up.setParam("literal.id", destFile.getAbsolutePath());
            up.setAction(AbstractUpdateRequest.ACTION.COMMIT, true, true);

            try {
                solr.request(up);

            } catch (SolrServerException sse) {
                sse.printStackTrace();
            }

        }

    }
    } catch (IOException ioe) {
      ioe.printStackTrace();   
    }

我已经读到,为了启用突出显示,我需要“存储/解析内容?”如何做到这一点?感谢您的帮助。

您将需要修改Solr实例的文件,并为
内容
字段设置
stored=“true”
。我假设您使用的是默认字段设置,以返回针对该字段的高亮显示结果


请参考矩阵,并说明必须启用哪些字段选项才能使突出显示和其他功能正常工作。

谢谢Paige。我在架构中找不到内容字段。我可以创建一个,但文本字段似乎已经在为数据编制索引。将其存储从false更改为true是否存在任何问题?此外,我没有更改ExtractingRequestHandler上的任何设置。不,更改文本字段上的存储值没有任何问题,因为我假设您要针对其突出显示。这是正确的。ExtractionRequestHandler的默认设置似乎是将其内容存储到文本字段中(见下文)。因此,我将保留默认值并更改文本字段上的存储值。(文本)