Parameters 过滤器示例Rapidminer中的参数字符串

Parameters 过滤器示例Rapidminer中的参数字符串,parameters,rapidminer,Parameters,Rapidminer,我有一个来自twitter的数据集。我需要删除与特定单词相关的推文。 我使用了“Filter Examples”操作符,并选择了“Condition class”->“attribute_value”。我遵循Rapidminer指南,但它不起作用。 它说: “当参数‘attribute_value_filter’被选为条件类时,此参数可用。条件格式是一个属性名称,后跟一个比较函数和一个要匹配的值。 标称属性可以通过=和!=与任意字符串进行比较,该字符串还可以包含正则表达式。” 因此,我键入: t

我有一个来自twitter的数据集。我需要删除与特定单词相关的推文。 我使用了“Filter Examples”操作符,并选择了“Condition class”->“attribute_value”。我遵循Rapidminer指南,但它不起作用。 它说:

“当参数‘attribute_value_filter’被选为条件类时,此参数可用。条件格式是一个属性名称,后跟一个比较函数和一个要匹配的值。 标称属性可以通过=和!=与任意字符串进行比较,该字符串还可以包含正则表达式。”

因此,我键入:
text{=strike!=}
还尝试:
text=strike=

'text'是我的属性的名称 “罢工”是我想删除的词

但是,我遇到了以下错误:

有人能指出我做错了什么吗?我试过几种变体,但出于愚蠢的原因,它不起作用


请客气一点,我对这方面还不太熟悉,我真的需要它来写我的论文。非常感谢你

要过滤掉包含特定单词的tweet,需要使用正则表达式语法。 最简单的表达是:

text != .*\sstrike[\s\.\!\,\.\:$].
text!=*罢工。*
但这也会过滤掉strike是另一个单词的一部分的文本,所以 也许更合适的是:

text != .*\sstrike[\s\.\!\,\.\:$].
阅读方式:过滤掉文本中的任何示例,这些示例在删除之前是任意字符和空格,后面是空格、标点符号或行尾