Tree 修改通用后缀树以保留节点在文本字符串中出现的次数

Tree 修改通用后缀树以保留节点在文本字符串中出现的次数,tree,suffix-tree,suffix-array,Tree,Suffix Tree,Suffix Array,如何修改中的过程,以将某个值保留在文本中某个单词出现的次数。有没有提供字符串频率的实现 我想要的修改类似于字符串“hehe”,树中所有“h”、“e”、“he”的频率计数都应该是2。Rest节点的默认值为1 我发现了一些像这样的库和以前的一些问题 但没有一个能很好地解决我的问题。我还需要处理一个非常大的字典文件(大约10亿个单词)。然后算法需要非常快。我准备对空间进行一点压缩。答案可以在这里找到: 基本上,构建后缀树,匹配从根开始的子字符串,并计算该点下方的叶节点。这是单词在文本中出现的次数

如何修改中的过程,以将某个值保留在文本中某个单词出现的次数。有没有提供字符串频率的实现

我想要的修改类似于字符串“hehe”,树中所有“h”、“e”、“he”的频率计数都应该是2。Rest节点的默认值为1

我发现了一些像这样的库和以前的一些问题


但没有一个能很好地解决我的问题。我还需要处理一个非常大的字典文件(大约10亿个单词)。然后算法需要非常快。我准备对空间进行一点压缩。

答案可以在这里找到:

基本上,构建后缀树,匹配从根开始的子字符串,并计算该点下方的叶节点。这是单词在文本中出现的次数