Solr-Tika-解析内容以启用高亮显示
我的理解是,通过Solr为PDF、Word、Excel等文档编制索引将允许搜索,但不允许突出显示。我有以下代码来执行索引:Solr-Tika-解析内容以启用高亮显示,solr,highlighting,apache-tika,Solr,Highlighting,Apache Tika,我的理解是,通过Solr为PDF、Word、Excel等文档编制索引将允许搜索,但不允许突出显示。我有以下代码来执行索引: String urlString = "http://localhost:8983/solr"; SolrServer solr = new HttpSolrServer(urlString); ContentStreamUpdateRequest up = new ContentStreamUpdateRequest("/
String urlString = "http://localhost:8983/solr";
SolrServer solr = new HttpSolrServer(urlString);
ContentStreamUpdateRequest up = new ContentStreamUpdateRequest("/update/extract");
for (MultipartFile file : files) {
if (file.getOriginalFilename().equals("")) {
continue;
}
File destFile = new File(destPath, file.getOriginalFilename());
file.transferTo(destFile);
up.addFile(destFile);
up.setParam("literal.id", destFile.getAbsolutePath());
up.setAction(AbstractUpdateRequest.ACTION.COMMIT, true, true);
try {
solr.request(up);
} catch (SolrServerException sse) {
sse.printStackTrace();
}
}
}
} catch (IOException ioe) {
ioe.printStackTrace();
}
我已经读到,为了启用突出显示,我需要“存储/解析内容?”如何做到这一点?感谢您的帮助。您将需要修改Solr实例的文件,并为
内容
字段设置stored=“true”
。我假设您使用的是默认字段设置,以返回针对该字段的高亮显示结果
请参考矩阵,并说明必须启用哪些字段选项才能使突出显示和其他功能正常工作。谢谢Paige。我在架构中找不到内容字段。我可以创建一个,但文本字段似乎已经在为数据编制索引。将其存储从false更改为true是否存在任何问题?此外,我没有更改ExtractingRequestHandler上的任何设置。不,更改文本字段上的存储值没有任何问题,因为我假设您要针对其突出显示。这是正确的。ExtractionRequestHandler的默认设置似乎是将其内容存储到文本字段中(见下文)。因此,我将保留默认值并更改文本字段上的存储值。(文本)