配置Solr以索引seed.txt中包含的元数据
我目前正在运行Nutch1.10和Solr5.3.1,我正在尝试对一些站点进行爬网和索引。这些站点有一个相关联的id和名称(与seed.txt文件中的url位于同一行),我希望将其与solr搜索结果中的其他字段(如主机、段等)一起包含。这可能吗?如果是这样,我是否需要修改seed.txt和schema-solr4以外的任何文件 seed.txt中的示例: www.exampleSite.com id=3 name=exampleSite配置Solr以索引seed.txt中包含的元数据,solr,field,metadata,nutch,Solr,Field,Metadata,Nutch,我目前正在运行Nutch1.10和Solr5.3.1,我正在尝试对一些站点进行爬网和索引。这些站点有一个相关联的id和名称(与seed.txt文件中的url位于同一行),我希望将其与solr搜索结果中的其他字段(如主机、段等)一起包含。这可能吗?如果是这样,我是否需要修改seed.txt和schema-solr4以外的任何文件 seed.txt中的示例: www.exampleSite.com id=3 name=exampleSite