使用Rapidminer并将数据存储在Excelsheet中的文本分类

使用Rapidminer并将数据存储在Excelsheet中的文本分类,excel,document,rapidminer,Excel,Document,Rapidminer,我正在使用Rapidminer进行朴素的Bayes文本分类。 我的培训集位于excel工作表中,有两列:第一列是标签,第二列是文本 我使用“读取Excel”操作符来读取Excel工作表。我使用“设置角色”操作符来确保“标签”列的角色为“标签”,而“文本”列的角色为“文本”。 然后,我使用数据到文档操作符和流程文档操作符token、stopword、stem、case等来处理数据。然而,当我尝试将数据移植到NaiveBayes操作符时,一个错误消息告诉我数据没有标记,并要求我使用Set-Role操

我正在使用Rapidminer进行朴素的Bayes文本分类。 我的培训集位于excel工作表中,有两列:第一列是标签,第二列是文本

我使用“读取Excel”操作符来读取Excel工作表。我使用“设置角色”操作符来确保“标签”列的角色为“标签”,而“文本”列的角色为“文本”。 然后,我使用数据到文档操作符和流程文档操作符token、stopword、stem、case等来处理数据。然而,当我尝试将数据移植到NaiveBayes操作符时,一个错误消息告诉我数据没有标记,并要求我使用Set-Role操作符。所以我在processdocuments操作符之后添加了另一个Set角色,只有属性名中的文本,标签消失了。
我不知道出了什么问题。

如果您在Data operator的流程文档之前设置断点,您应该会看到一个带有角色标签的属性,可能带有类型Polynominal,另一个属性带有角色regular和类型text。如果这是确定的,它应该工作

确保在“来自数据操作员的流程文档”上设置了“添加元信息”复选框


如果仍然不起作用,那么下一步就是发布流程XML。

明白了。我应该使用“来自数据的流程文档”,但我使用的是流程文档……非常感谢。