Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/solr/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Solr标记器注入_Solr_Tokenize - Fatal编程技术网

Solr标记器注入

Solr标记器注入,solr,tokenize,Solr,Tokenize,例如,我有一个文本字段,其中可能包含以下字符串: “d7199^^==^^^81^=^^=^^一两句话!!” 我想标记这些数据,但每个标记都包含字符串的第一部分。因此,对于上面的示例,我希望令牌如下所示: “d7199^^==^^81^^==^^a” “d7199^^==^^81^^==^^句” “d7199^^==^^81^^==^^或” “d7199^^==^^81^^==^^2” 我该怎么做呢?您可以实现自己的自定义并将其添加到Solr类路径中。然后在Solr schema.xml和sol

例如,我有一个文本字段,其中可能包含以下字符串:

“d7199^^==^^^81^=^^=^^一两句话!!”

我想标记这些数据,但每个标记都包含字符串的第一部分。因此,对于上面的示例,我希望令牌如下所示:

“d7199^^==^^81^^==^^a”

“d7199^^==^^81^^==^^句”

“d7199^^==^^81^^==^^或”

“d7199^^==^^81^^==^^2”


我该怎么做呢?

您可以实现自己的自定义并将其添加到Solr类路径中。然后在Solr schema.xml和solrconfig.xml中使用它

经过一番研究,这也是我最符合逻辑的结论。如果你能给我举几个好例子的话,赏金都是你的!您如何知道输入的第一部分何时结束?我可以定义不同的分隔符,也可以让它在最后一个标记处结束^^^==^^^。如果你有更好的建议。离赏金到期还有3天:(很明显,必须对标记器进行子类化,但如何进行?从扩展或