Solr-按组划分的聚合术语频率

Solr-按组划分的聚合术语频率,solr,lucene,lucidworks,Solr,Lucene,Lucidworks,假设我在Solr(最新版本)中对以下一组分组网站进行了爬网和索引: 我正在寻找一个结果集,它将为我提供每个域中的术语频率,以及该搜索术语的聚合术语频率(按domainGroup聚合) 研究这一点,我发现了3种可能性: 1和2是不同的,我不确定哪一个适合我,或者更糟的是,通过“选项”3也不确定 对不起,如果不清楚的话。我试图检索“搜索词”的频率,但我还需要按domainGroup字段聚合的频率。换句话说,我需要在一个请求中搜索所有域中的“搜索词”,并不仅检索单个域中的“搜索词”频率(默认值)

假设我在Solr(最新版本)中对以下一组分组网站进行了爬网和索引:

我正在寻找一个结果集,它将为我提供每个域中的术语频率,以及该搜索术语的聚合术语频率(按domainGroup聚合)

研究这一点,我发现了3种可能性:

  • 1和2是不同的,我不确定哪一个适合我,或者更糟的是,通过“选项”3也不确定


    对不起,如果不清楚的话。我试图检索“搜索词”的频率,但我还需要按domainGroup字段聚合的频率。换句话说,我需要在一个请求中搜索所有域中的“搜索词”,并不仅检索单个域中的“搜索词”频率(默认值),还检索所有域组的聚合频率(因此相同域组下所有域中的词频率之和).

    我认为,带有术语频率向量的方面就是您所需要的。 请尝试以下查询:

    http://something/solr/select/?qt=tvrh&q=query:http://www.category2website1.com&tv.fl=query&tv.all=true&f.id.tv.tf=true&facet.field=domainGroup&facet=true&facet.limit=-1&facet.mincount=1
    

    谢谢,但这还不足以帮助我,我的帖子中已经链接了这个查询(或类似的查询),但是我还没有到测试查询的地步。我需要一个更明确/详细的答案,因为我发布的链接不足以让我理解。只是为了确保,您的搜索词查询涉及另一个字段,例如“内容”,您需要在该特定字段上使用这些词的频率?不清楚您试图实现什么。您是否正在尝试检索“搜索词”的频率?如果是这种情况,我们不是在讨论“术语向量”,如果不清楚,第一种和第二种可能性也是相同的。是的,我正在尝试检索“搜索词”的频率,但我需要通过
    domainGroup
    字段聚合的频率。换句话说,我需要在一个请求中搜索所有域中的“搜索词”,并不仅检索单个域中的“搜索词”频率(默认值),还检索所有域组的聚合频率(因此是同一域组下所有域中的词频率之和)。
    http://something/solr/select/?qt=tvrh&q=query:http://www.category2website1.com&tv.fl=query&tv.all=true&f.id.tv.tf=true&facet.field=domainGroup&facet=true&facet.limit=-1&facet.mincount=1