在R中按短语过滤单词列表
在R中,我将聊天日志放在一个单词数据框中,如下所示 我使用dplyr按单词进行筛选以确定每个单词的计数,例如在R中按短语过滤单词列表,r,dataframe,filter,dplyr,R,Dataframe,Filter,Dplyr,在R中,我将聊天日志放在一个单词数据框中,如下所示 我使用dplyr按单词进行筛选以确定每个单词的计数,例如筛选(单词百分比在%word\u pick中) 有没有一种方法可以按特定短语过滤,例如“Hello world”,我可以分别搜索“Hello”和“world”,但不能一起搜索,因为每个单词都是一行 理想情况下,我想要一种在数据帧的下一行中搜索带有“world”的“Hello”的方法。我认为您可以通过dplyr语法中的grepl来搜索模式 例如,您正在查找包含“hello”的行,其下一行是
筛选(单词百分比在%word\u pick中)
有没有一种方法可以按特定短语过滤,例如“Hello world”,我可以分别搜索“Hello”和“world”,但不能一起搜索,因为每个单词都是一行
理想情况下,我想要一种在数据帧的下一行中搜索带有“world”的“Hello”的方法。我认为您可以通过dplyr语法中的
grepl
来搜索模式
例如,您正在查找包含“hello”的行,其下一行是“world”
我正在寻找包含“hello”的行,后面紧跟着一行包含“world”。@gregohamill好的,我更新了答案。请检查一下。
library(dplyr)
data %>%
filter(grepl('hello',your_colum) & grepl('world',lead(your_colum)))