Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/solr/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java Solr中的词频_Java_Solr_Word Frequency - Fatal编程技术网

Java Solr中的词频

Java Solr中的词频,java,solr,word-frequency,Java,Solr,Word Frequency,我正在尝试使用solr获取单词的频率。当我提出这个问题时: localSolr/solr/select?q=someQuery&rows=0&facet=true&facet.field=content&wt=xml solr给了我这样的频率 <lst name="facet_counts"> <lst name="facet_queries"/> <lst name="facet_fields"> <lst name=

我正在尝试使用solr获取单词的频率。当我提出这个问题时:

localSolr/solr/select?q=someQuery&rows=0&facet=true&facet.field=content&wt=xml
solr给了我这样的频率

<lst name="facet_counts">
<lst name="facet_queries"/>
<lst name="facet_fields">
<lst name="content">
<int name="word1">24</int>
<int name="word2">12</int>
<int name="word3">8</int>
所以频率返回错误。我已经检查了facet字段,但没有找到相应的参数。我如何修正它,使它在句子中计数相同的单词

编辑: schema.xml的相关部分:

<fieldType name="text_tr" class="solr.TextField" positionIncrementGap="100">
    <field name="content" type="text_tr" stored="true" indexed="true" multiValued="true"/>
    <copyField source="content" dest="text"/>
    <field name="text" type="text_tr" stored="false" indexed="true" multiValued="true"/>

如果正在刻面的字段是多值字段,则刻面中的每个字都会得到正确的计数

我忘了提一件事:我会把你带到你需要的地方

在查询中,tv.tf将为您提供每个术语的术语频率,tv.fl告诉solr应该在哪些字段上计算频率


NB这会使您的索引时间比现在慢(aka:您必须尝试一下)

使用luke请求处理程序

http://localhost:8983/solr/admin/luke?fl=YOUR_TEXT_FIELD&numTerms=500


更多信息:

谢谢您的回答。我已更改字段以使多值参数为true,但它仍然返回错误的答案。能否发布schema.xml,以便我可以向您提供更多信息?抱歉,我无法放置所有schema.xml,但我已编辑并放置了相关部分。我希望有帮助。很好的解释there@Samueleyns我知道你问/回答这个问题已经有一段时间了,但我也有类似的问题,我遵循了TermVectorComponent中的指导原则,但在设置TermVectorComponent的“文本”字段后,我不知道在yns问题中显示的http请求中要更改什么?
<fieldType name="text_tr" class="solr.TextField" positionIncrementGap="100">
    <field name="content" type="text_tr" stored="true" indexed="true" multiValued="true"/>
    <copyField source="content" dest="text"/>
    <field name="text" type="text_tr" stored="false" indexed="true" multiValued="true"/>