Data structures 用于基准测试的随机单词大文本文件词典?

Data structures 用于基准测试的随机单词大文本文件词典?,data-structures,text,dataset,computer-science,Data Structures,Text,Dataset,Computer Science,我想知道是否有人能给我指出一个非常大的随机词字典,可以用来测试一些高性能的字符串数据结构?我发现一些在~2MB范围内。。。不过,如果可能的话,我想要大一点的。我猜一定有一些大型的标准字符串数据集可以使用。谢谢 诺维格的拼写检查器文章中提到了上述链接-我建议大家浏览一下(文本检索会议)上提供的资料。一些很好的数据集可能满足您的要求

我想知道是否有人能给我指出一个非常大的随机词字典,可以用来测试一些高性能的字符串数据结构?我发现一些在~2MB范围内。。。不过,如果可能的话,我想要大一点的。我猜一定有一些大型的标准字符串数据集可以使用。谢谢


诺维格的拼写检查器文章中提到了上述链接-

我建议大家浏览一下(文本检索会议)上提供的资料。一些很好的数据集可能满足您的要求