Unix 为字典生成字数
我有一个索引过程,它从mysql数据库中获取文档并将它们放入solr 我想记录每个单词出现的次数,以便进行拼写更正Unix 为字典生成字数,unix,dictionary,Unix,Dictionary,我有一个索引过程,它从mysql数据库中获取文档并将它们放入solr 我想记录每个单词出现的次数,以便进行拼写更正 很明显,我可以在运行时将它们全部转储到一个纯文本文件中,然后对该文件进行排序,并将所有单词的计数保持在某个N以上-这是一种方式,还是有更聪明的方式?在SOLR中,你有方面。您可以尝试执行facet搜索,facet.field指向存储您感兴趣的文本数据的字段。可以使用facet.mincount在特定频率级别上剪切输出列表。确保将facet.zeroes=false设置为从结果频率列
很明显,我可以在运行时将它们全部转储到一个纯文本文件中,然后对该文件进行排序,并将所有单词的计数保持在某个N以上-这是一种方式,还是有更聪明的方式?在SOLR中,你有方面。您可以尝试执行facet搜索,facet.field指向存储您感兴趣的文本数据的字段。可以使用facet.mincount在特定频率级别上剪切输出列表。确保将facet.zeroes=false设置为从结果频率列表中排除任何可能的零。在SOLR中,您有facet。您可以尝试执行facet搜索,facet.field指向存储您感兴趣的文本数据的字段。可以使用facet.mincount在特定频率级别上剪切输出列表。确保设置facet.zeroes=false以从结果频率列表中排除任何可能的零