R 改变以句型开头的单词
我正在分析政治演讲,想标准化一些方言词。我想把所有以“fra”开头的单词改成以“fre”开头 例如: “弗拉德走进酒吧”变成了“弗雷德走进酒吧” “你是弗瑞德吗”变成了“你是弗瑞德吗” “你害怕吗”不应该改变,保持不变 我在R怎么做R 改变以句型开头的单词,r,text,nlp,speech,dialect,R,Text,Nlp,Speech,Dialect,我正在分析政治演讲,想标准化一些方言词。我想把所有以“fra”开头的单词改成以“fre”开头 例如: “弗拉德走进酒吧”变成了“弗雷德走进酒吧” “你是弗瑞德吗”变成了“你是弗瑞德吗” “你害怕吗”不应该改变,保持不变 我在R怎么做 演讲与一些元数据一起存储在一个数据框中,其中变量text存储一年内每位政治家的演讲。您要查找的内容称为正则表达式: text <- c("frad walked into a bar", "are you frad", "are you afraid") g
演讲与一些元数据一起存储在一个数据框中,其中变量text存储一年内每位政治家的演讲。您要查找的内容称为正则表达式:
text <- c("frad walked into a bar", "are you frad", "are you afraid")
gsub("\\bfra", "fre", text)
#> [1] "fred walked into a bar" "are you fred" "are you afraid"
text[1]“弗雷德走进酒吧”“你是弗雷德吗”“你害怕吗”
在这种情况下,
\\b
表示单词的开头或结尾。你可以用它来了解更多或找到另一个好的资源。这是否回答了你的问题?我想不太清楚,因为字符串只有在单词开头时才应该被替换。为什么不使用“\\Trygsub(\\bfra”,“fre”,“frad is frable”)
我从来没有听说过”。\\n我的观点是,frable不应该改变,这个任务可能比现在介绍的要复杂得多。但如果OP对这一点很好,那么我想一切都是好的。在我的例子中,最重要的是,不同方言的政客使用同一个词,如果它表达相同的意思(弗雷德应该是弗雷德或弗拉德)。所以,在这个分析中,把易碎品换成弗雷吉尔并不重要,只要这个词只有一个版本。谢谢大家!