Machine learning 如何防止weka中的雪球式炮管堵塞;“可怕的”;至;aw";?

Machine learning 如何防止weka中的雪球式炮管堵塞;“可怕的”;至;aw";?,machine-learning,weka,text-mining,text-classification,Machine Learning,Weka,Text Mining,Text Classification,我使用Weka对2000部IMBD电影评论进行分类。我正在关注以下内容: 每当我做词干分析时,“糟糕”这个词就变成了“aw”。我甚至尝试了包含的Lovinsstember,得到了同样的结果。页面中提到的tutroial仍在做词干部分,但他在属性列表中有“可怕”的单词 另外,我是Weka的新手,所以可能是我对雪球词干分析器的实现不正确。 我刚刚下载了这个jar文件: 我这样设置类路径:java-classpath“weka.jar:snowball-20051019.jar”weka.gui.

我使用Weka对2000部IMBD电影评论进行分类。我正在关注以下内容:

每当我做词干分析时,“糟糕”这个词就变成了“aw”。我甚至尝试了包含的Lovinsstember,得到了同样的结果。页面中提到的tutroial仍在做词干部分,但他在属性列表中有“可怕”的单词

另外,我是Weka的新手,所以可能是我对雪球词干分析器的实现不正确。 我刚刚下载了这个jar文件:

我这样设置类路径:java-classpath“weka.jar:snowball-20051019.jar”weka.gui.GUIChooser在您的数据集中,“糟糕”一词是第237列。要在筛选操作中省略它,请在属性“AttributeIndicates”中,将“first-last”更改为1-236238-last。(未经测试,在我的脑海中)

在您的数据集中,“糟糕”一词出现在第237列。要在筛选操作中省略它,请在属性“AttributeIndicates”中,将“first-last”更改为1-236238-last。(未经测试,从我的头顶)