Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/solr/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
SOLR—在将文档添加到SOLR时,如何从文档中提取字段值?_Solr - Fatal编程技术网

SOLR—在将文档添加到SOLR时,如何从文档中提取字段值?

SOLR—在将文档添加到SOLR时,如何从文档中提取字段值?,solr,Solr,将SolrJ与SOLR 1.4.1一起使用 所以我定义了一组字段,我想在这些字段上建立索引。假设我有数百个文档(假设它们是文本文件),我想将它们添加到SOLR中为其创建索引。我是否有办法向SOLR提供文档并让它在每个文档中找到字段值 例如,假设SOLR模式中有一个名为“manufacturer”的字段。我还有一份文件,内容如下: Lorem ipsum dolor sit amet,Concetetur Adipising Elite,sed do 临时劳动合同 多洛雷·麦格纳·阿利夸。最小值

将SolrJ与SOLR 1.4.1一起使用

所以我定义了一组字段,我想在这些字段上建立索引。假设我有数百个文档(假设它们是文本文件),我想将它们添加到SOLR中为其创建索引。我是否有办法向SOLR提供文档并让它在每个文档中找到字段值

例如,假设SOLR模式中有一个名为“manufacturer”的字段。我还有一份文件,内容如下:

Lorem ipsum dolor sit amet,Concetetur Adipising Elite,sed do 临时劳动合同 多洛雷·麦格纳·阿利夸。最小值 veniam,quis nostrud实习 ullamco laboris nisi ut aliquip ex ea 康多康塞卡特。酒后驾车 多洛制造商acme在voluptate的reprehenderit中 你的福吉亚语是什么 无巴黎特许权。圣岛例外 非偶然的,必须的 在这件事上,我是罪有应得 动物是劳动

我可以让SOLR从文档中提取“acme”作为字段“manufacturer”的值吗?或者,在将每个文档添加到SOLR中之前,是否需要手动检查每个文档,并手动查找每个字段的值,例如:

SolrInputDocument doc = new SolrInputDocument();
doc.addField("manufacturer", "acme");

Solr中没有内置的方法来实现这一点。您有两个选择:

  • 手工构建Solr JSON/XML输入文档
  • 使用自然语言处理对文档进行注释,然后使用注释生成单个Solr字段(请参阅)
  • 编写自己的,通过正则表达式、XPath或任何适合您的方式从文档中提取字段

    • 在Solr中没有内置的方法来实现这一点。您有两个选择:

      • 手工构建Solr JSON/XML输入文档
      • 使用自然语言处理对文档进行注释,然后使用注释生成单个Solr字段(请参阅)
      • 编写自己的,通过正则表达式、XPath或任何适合您的方式从文档中提取字段