使用Rapidminer并将数据存储在Excelsheet中的文本分类_Excel_Document_Rapidminer

使用Rapidminer并将数据存储在Excelsheet中的文本分类

excel

使用Rapidminer并将数据存储在Excelsheet中的文本分类,excel,document,rapidminer,Excel,Document,Rapidminer,我正在使用Rapidminer进行朴素的Bayes文本分类。我的培训集位于excel工作表中，有两列：第一列是标签，第二列是文本我使用“读取Excel”操作符来读取Excel工作表。我使用“设置角色”操作符来确保“标签”列的角色为“标签”，而“文本”列的角色为“文本”。然后，我使用数据到文档操作符和流程文档操作符token、stopword、stem、case等来处理数据。然而，当我尝试将数据移植到NaiveBayes操作符时，一个错误消息告诉我数据没有标记，并要求我使用Set-Role操

我正在使用Rapidminer进行朴素的Bayes文本分类。我的培训集位于excel工作表中，有两列：第一列是标签，第二列是文本

我使用“读取Excel”操作符来读取Excel工作表。我使用“设置角色”操作符来确保“标签”列的角色为“标签”，而“文本”列的角色为“文本”。然后，我使用数据到文档操作符和流程文档操作符token、stopword、stem、case等来处理数据。然而，当我尝试将数据移植到NaiveBayes操作符时，一个错误消息告诉我数据没有标记，并要求我使用Set-Role操作符。所以我在processdocuments操作符之后添加了另一个Set角色，只有属性名中的文本，标签消失了。

我不知道出了什么问题。

如果您在Data operator的流程文档之前设置断点，您应该会看到一个带有角色标签的属性，可能带有类型Polynominal，另一个属性带有角色regular和类型text。如果这是确定的，它应该工作

确保在“来自数据操作员的流程文档”上设置了“添加元信息”复选框

如果仍然不起作用，那么下一步就是发布流程XML。

明白了。我应该使用“来自数据的流程文档”，但我使用的是流程文档……非常感谢。