Java 如何从文档文本中筛选常用词?(散列图)

Java 如何从文档文本中筛选常用词?(散列图),java,hashmap,hashset,Java,Hashmap,Hashset,谢谢你的阅读。我现在有一个学校的项目,我真的很坚持。其目的是从web检索文档文本,然后将每个单词存储到地图对象中,同时省略常用的单词,如“which、about、during、after”等 基本上可以归结为: //要忽略的单词列表 Set<String> ignore = new HashSet<>(Arrays.asList(new String[]{ "after", "which", "later", "other", "during", "their

谢谢你的阅读。我现在有一个学校的项目,我真的很坚持。其目的是从web检索文档文本,然后将每个单词存储到地图对象中,同时省略常用的单词,如“which、about、during、after”等

基本上可以归结为:

//要忽略的单词列表

    Set<String> ignore = new HashSet<>(Arrays.asList(new String[]{
  "after", "which", "later", "other", "during", "their", "about"}));

因此,现在在这个while循环中,我希望跳过忽略集中的任何单词,否则将其添加到映射对象中。。。但是,我似乎不能得到它的权利,似乎没有任何东西为我点击。我可以很容易地将所有单词添加到地图对象中,并进行一些扣分,但我希望能够正确地进行此操作,以保持我的理智。

您的忽略单词列表提供了一种方法,因此 只需在循环中添加以下条件:

if(!ignore.contains(word))
{
    //addToList
}

我想你的意思是
如果(!ignore.contains(word))
?从该文档中,你可以看到contains函数“如果该集合包含指定的元素,则返回true”。我很欣赏快速的响应,当然还有如此简单的解决方案。在我的脑海里,我把if语句倒过来,或者尝试使用equals方法。谢谢谢谢。@Wexylwoxyl不客气。也感谢阿努比亚和贾斯汀修正了我的答案。A+感谢Jean FrançoisSavard的努力!
if(!ignore.contains(word))
{
    //addToList
}