R 查找原始输入数据表是否至少包含列表中的一个单词

R 查找原始输入数据表是否至少包含列表中的一个单词,r,datatable,R,Datatable,我对R和数据表非常陌生,所以我的问题可能听起来很明显,但我在这里搜索了类似的问题,但还是找不到解决方案 所以,最初,我有一个数据表,其中一行包含的字段有许多值(事实上这些值都是单独的单词),这些值通过&&&&&&&&&连接在一起。我还有一个单词列表(list)。这个列表很大,有38000个不同的单词。但出于示例的目的,让我们假设它很小 列出试试: 我在这里使用了word\u list而不是list,因为list是R中的内置函数。请尝试: data_final[sapply(strsplit(da

我对R和数据表非常陌生,所以我的问题可能听起来很明显,但我在这里搜索了类似的问题,但还是找不到解决方案

所以,最初,我有一个数据表,其中一行包含的字段有许多值(事实上这些值都是单独的单词),这些值通过&&&&&&&&&连接在一起。我还有一个单词列表(list)。这个列表很大,有38000个不同的单词。但出于示例的目的,让我们假设它很小

列出试试:

我在这里使用了
word\u list
而不是
list
,因为
list
是R中的内置函数。

请尝试:

data_final[sapply(strsplit(data_final$fields_with_words,"&&&&"), function(x) 
                  any(x %in% word_list)), ]

我在这里使用了
word\u list
而不是
list
,因为
list
是R中的内置函数。

假设您想用单词列表
lw扫描
df中的
x
变量,假设您想用单词列表
lw
扫描
df中的
x
变量,请参见
match
%in%
,即
字段与%list
中的%u单词匹配。请参阅
match
%in%
,即
字段与%list中的%u单词匹配
。谢谢!它起作用了,花了一些时间,但它起作用了,真是松了一口气谢谢!它起作用了,花了一些时间,但它起作用了,这是一种解脱