Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/unix/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Unix 为字典生成字数_Unix_Dictionary - Fatal编程技术网

Unix 为字典生成字数

Unix 为字典生成字数,unix,dictionary,Unix,Dictionary,我有一个索引过程,它从mysql数据库中获取文档并将它们放入solr 我想记录每个单词出现的次数,以便进行拼写更正 很明显,我可以在运行时将它们全部转储到一个纯文本文件中,然后对该文件进行排序,并将所有单词的计数保持在某个N以上-这是一种方式,还是有更聪明的方式?在SOLR中,你有方面。您可以尝试执行facet搜索,facet.field指向存储您感兴趣的文本数据的字段。可以使用facet.mincount在特定频率级别上剪切输出列表。确保将facet.zeroes=false设置为从结果频率列

我有一个索引过程,它从mysql数据库中获取文档并将它们放入solr

我想记录每个单词出现的次数,以便进行拼写更正


很明显,我可以在运行时将它们全部转储到一个纯文本文件中,然后对该文件进行排序,并将所有单词的计数保持在某个N以上-这是一种方式,还是有更聪明的方式?

在SOLR中,你有方面。您可以尝试执行facet搜索,facet.field指向存储您感兴趣的文本数据的字段。可以使用facet.mincount在特定频率级别上剪切输出列表。确保将facet.zeroes=false设置为从结果频率列表中排除任何可能的零。

在SOLR中,您有facet。您可以尝试执行facet搜索,facet.field指向存储您感兴趣的文本数据的字段。可以使用facet.mincount在特定频率级别上剪切输出列表。确保设置facet.zeroes=false以从结果频率列表中排除任何可能的零