Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/solr/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何在ApacheSolr中索引文本文件_Solr_Indexing_Lucene - Fatal编程技术网

如何在ApacheSolr中索引文本文件

如何在ApacheSolr中索引文本文件,solr,indexing,lucene,Solr,Indexing,Lucene,我在一个文本文件中有一些信息。我想在solr上建立索引。程序应该是什么。有没有可以在solr中用于索引的工具?请详细指导我,因为我不熟悉solr to mutch?一种方法是将纯文本转换为CSV文件。然后,您可以使用CSV文件上载过程为Solr中的数据编制索引。查看此处的文档了解更多配置 我想请您参考第页,它有一个关于如何从各种来源导入数据的全面教程。导入文本文件在下,我应该使用apache tika进行索引吗?文本文件的结构是什么?你在这个文件里放的是什么样的数据?基本上我有一些图像,在文本文

我在一个文本文件中有一些信息。我想在solr上建立索引。程序应该是什么。有没有可以在solr中用于索引的工具?请详细指导我,因为我不熟悉solr to mutch?

一种方法是将纯文本转换为CSV文件。然后,您可以使用CSV文件上载过程为Solr中的数据编制索引。查看此处的文档了解更多配置

我想请您参考第页,它有一个关于如何从各种来源导入数据的全面教程。导入文本文件在

下,我应该使用apache tika进行索引吗?文本文件的结构是什么?你在这个文件里放的是什么样的数据?基本上我有一些图像,在文本文件里我有一些关于这个图像的信息,例如一些在图像里的文本等。现在我想在solr中索引这个文本文件,这样当我搜索那个特定的文本时,我会在结果中得到那个图像。好的。IMO使用ApacheTika会很麻烦。在这种情况下,您必须为该文件结构编写自己的解析器,并减少其设置的开销。此外,tika通常更倾向于从复杂的文件结构(如PDF、ppt)中提取数据。等等。据我所知,如果你能将文本文件作为CSV生成,你就没有什么需要做的了。你能指导我如何为文本文件编写解析器吗