Java 计算文件中重复的单词
目标:查找文件中所有单词的计数。文件包含1000多个字 我的方法是:使用Java 计算文件中重复的单词,java,string,data-structures,hashmap,Java,String,Data Structures,Hashmap,目标:查找文件中所有单词的计数。文件包含1000多个字 我的方法是:使用HashMap()存储并计算每个单词在文件中出现的次数 问题: HashMap()是最好的方法,还是最好使用二叉树来确保更快的查找,因为文件中有大量的字 还是有更好的方法 HashMap将导致大量不需要的内存开销。1000-10000个字非常小 Hashmap很好。Hashmap很完美。你需要储存 遇到的每个单词的副本 每一个的计数 HashMap真的不会存储更多 那么你在寻找不同的词 我能想到的最有效的结构是 下面是一
HashMap()
存储并计算每个单词在文件中出现的次数
问题:
HashMap()
是最好的方法,还是最好使用二叉树来确保更快的查找,因为文件中有大量的字
还是有更好的方法
HashMap将导致大量不需要的内存开销。1000-10000个字非常小
Hashmap很好。Hashmap很完美。你需要储存
- 遇到的每个单词的副本
- 每一个的计数
HashMap真的不会存储更多 那么你在寻找不同的词 我能想到的最有效的结构是 下面是一个开源实现: 虽然我倾向于同意Mitch Wheat的观点,但听起来HashMap应该可以很好地工作(最好避免过早的优化…所以你应该使用HashMap,直到你证明它是一个瓶颈)
我建议用Perl/PHP完成这样的任务。用机关枪杀苍蝇很难 让我们为此创建一个代码;)