使用ApacheSolr索引文本文件

使用ApacheSolr索引文本文件,solr,apache-tika,Solr,Apache Tika,我想索引solr中的文本文件。但是我的数据很大,所以我想逐段索引它。使用ApacheTika我无法做到这一点。有人能帮我用DataImportHandler吗。我目前正在使用Solr-6.5.1此问题存在严重的格式或内容问题。此问题不太可能通过编辑解决,可能需要删除。您现在是如何尝试为文件编制索引的?在提交文件之前,你能将文件预处理成单独的段落吗?您希望文档在Solr中如何结构化?文本文件有多大?您遇到了什么错误?目前我正在使用curl“-F myFile=@files/sample.txt为文

我想索引solr中的文本文件。但是我的数据很大,所以我想逐段索引它。使用ApacheTika我无法做到这一点。有人能帮我用DataImportHandler吗。我目前正在使用Solr-6.5.1

此问题存在严重的格式或内容问题。此问题不太可能通过编辑解决,可能需要删除。您现在是如何尝试为文件编制索引的?在提交文件之前,你能将文件预处理成单独的段落吗?您希望文档在Solr中如何结构化?文本文件有多大?您遇到了什么错误?目前我正在使用curl“-F myFile=@files/sample.txt为文件编制索引,我在段落中有数据。我想要的功能是,在solr中搜索时,它不应该提供文档的全部内容。相反,我希望将搜索结果减少到查询关键字出现在的段落中。Re“您希望文档如何在Solr中结构化?”我希望它们逐段显示。Re“文本文件有多大?”足够大,以至于我在文档中找不到要搜索的关键字