Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/hadoop/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/solr/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
&引用;Hadoop Solr Lucidworks项目;检索输入名称路径_Hadoop_Solr_Lucidworks - Fatal编程技术网

&引用;Hadoop Solr Lucidworks项目;检索输入名称路径

&引用;Hadoop Solr Lucidworks项目;检索输入名称路径,hadoop,solr,lucidworks,Hadoop,Solr,Lucidworks,我正在使用此项目: 是否有人知道正在处理的文档的名称(或路径)保存在哪个值中。我想将该值检索到Solr Admin(将一个字段及其名称添加到我的模式)。这可能吗 示例:我希望能够看到文档的名称,查询将从中返回相同的结果 我正在使用以下命令运行项目: hadoop jar solr-hadoop-job-2.2.5.jar com.lucidworks.hadoop.ingest.IngestJob -Dlww.commit.on.close=true -DcsvDe

我正在使用此项目: 是否有人知道正在处理的文档的名称(或路径)保存在哪个值中。我想将该值检索到Solr Admin(将一个字段及其名称添加到我的模式)。这可能吗

示例:我希望能够看到文档的名称,查询将从中返回相同的结果

我正在使用以下命令运行项目:

    hadoop jar solr-hadoop-job-2.2.5.jar 
    com.lucidworks.hadoop.ingest.IngestJob  
    -Dlww.commit.on.close=true -DcsvDelimiter= 
   -cls com.lucidworks.hadoop.ingest.CSVIngestMapper -c spyros1  
    - i  /usr/local/hadoop/input 
    -of com.lucidworks.hadoop.io.LWMapRedOutputFormat 
    -s http://127.0.1.1:8983/solr

对于
CSVIngestMapper
,文件路径当前未添加到任何Solr字段

可以在回购协议中随意创建一个问题

也欢迎PRs

编辑:(有关解决方案,请参阅)

这对我很有用:

hadoop jar solr-hadoop-job-2.2.5.jar com.lucidworks.hadoop.ingest.IngestJob  
    -Dlww.commit.on.close=true 
    -Dcom.lucidworks.hadoop.ingest.RegexIngestMapper.regex="\\w+" 
   -Dcom.lucidworks.hadoop.ingest.RegexIngestMapper.groups_to_fields=0=match_ss  
   -cls com.lucidworks.hadoop.ingest.RegexIngestMapper  
   -c collection1 -i /path/* -s http://127.0.1.1:8983/solr
   -of com.lucidworks.hadoop.io.LWMapRedOutputFormat 

有关更多信息,请参见。

那么有没有办法检索结果所属文档的名称或路径?如果我使用2个txt文档,我应该如何知道结果来自哪个txt。是否可用于任何其他摄取映射器@acesar>是否可用于任何其他摄取映射器?是的,RegexIngestMapper/GrokIngestMapper会添加一个名为path的字段。但我不能完全确定我是否遵循了您的用例。我正在为我的集合使用“数据驱动的模式配置”。该字段必须添加到数据驱动模式配置的
托管模式
中,对吗@阿塞萨尔