R 改变以句型开头的单词

R 改变以句型开头的单词,r,text,nlp,speech,dialect,R,Text,Nlp,Speech,Dialect,我正在分析政治演讲,想标准化一些方言词。我想把所有以“fra”开头的单词改成以“fre”开头 例如: “弗拉德走进酒吧”变成了“弗雷德走进酒吧” “你是弗瑞德吗”变成了“你是弗瑞德吗” “你害怕吗”不应该改变,保持不变 我在R怎么做 演讲与一些元数据一起存储在一个数据框中,其中变量text存储一年内每位政治家的演讲。您要查找的内容称为正则表达式: text <- c("frad walked into a bar", "are you frad", "are you afraid") g

我正在分析政治演讲,想标准化一些方言词。我想把所有以“fra”开头的单词改成以“fre”开头

例如:

“弗拉德走进酒吧”变成了“弗雷德走进酒吧”

“你是弗瑞德吗”变成了“你是弗瑞德吗”

“你害怕吗”不应该改变,保持不变

我在R怎么做


演讲与一些元数据一起存储在一个数据框中,其中变量text存储一年内每位政治家的演讲。

您要查找的内容称为正则表达式:

text <- c("frad walked into a bar", "are you frad", "are you afraid")

gsub("\\bfra", "fre", text)
#> [1] "fred walked into a bar" "are you fred"           "are you afraid"
text[1]“弗雷德走进酒吧”“你是弗雷德吗”“你害怕吗”

在这种情况下,
\\b
表示单词的开头或结尾。你可以用它来了解更多或找到另一个好的资源。

这是否回答了你的问题?我想不太清楚,因为字符串只有在单词开头时才应该被替换。为什么不使用“\\Try
gsub(\\bfra”,“fre”,“frad is frable”)
我从来没有听说过
”。\\n我的观点是,frable不应该改变,这个任务可能比现在介绍的要复杂得多。但如果OP对这一点很好,那么我想一切都是好的。在我的例子中,最重要的是,不同方言的政客使用同一个词,如果它表达相同的意思(弗雷德应该是弗雷德或弗拉德)。所以,在这个分析中,把易碎品换成弗雷吉尔并不重要,只要这个词只有一个版本。谢谢大家!