替换表达式'&;auml';由';ae';在R

替换表达式'&;auml';由';ae';在R,r,csv,replace,R,Csv,Replace,我已经在RSTUDIO中导入了一个.csv,其中包含多行和多列(字母数字值),其中包含ä用于德语“ä” 接下来我想做一些文本挖掘,但首先我必须替换所有的ä带“ae”的表达式。(或者类似地,带有“ue”的ü;) 我查找了gsub、regmatches之类的命令……但我没有找到:-( 我只是想找到一种方法来搜索所有ü;表达式,并用“ä”或“ae”替换它们 有人能帮我吗?谢谢,这是一个关于如何使用gsub的快速示例,应该会让你开始学习 我们首先创建一个短字符向量 cha

我已经在RSTUDIO中导入了一个.csv,其中包含多行和多列(字母数字值),其中包含
ä用于德语“ä”

接下来我想做一些文本挖掘,但首先我必须替换所有的
ä带“ae”的表达式。(或者类似地,带有“ue”的
ü;

我查找了gsub、regmatches之类的命令……但我没有找到:-( 我只是想找到一种方法来搜索所有
ü;
表达式,并用“ä”或“ae”替换它们


有人能帮我吗?谢谢,这是一个关于如何使用gsub的快速示例,应该会让你开始学习

我们首先创建一个短字符向量

characters <- c("a small phrase", "a longer phrase", "a", "word")
第一个参数指定要查找的内容,第二个参数指定要替换的内容,第三个参数指定要将其应用到的对象

然后,我们可以通过将gsub的输出分配给characters对象来更改它

characters <- gsub("phrase", "something", characters)

此外,除非您真的需要umlauted字符,否则最好使用拉丁等效字符(ae),因为并非所有的R函数都有很好的unicode支持。

这是一个如何使用gsub的快速示例,应该可以帮助您入门

我们首先创建一个短字符向量

characters <- c("a small phrase", "a longer phrase", "a", "word")
第一个参数指定要查找的内容,第二个参数指定要替换的内容,第三个参数指定要将其应用到的对象

然后,我们可以通过将gsub的输出分配给characters对象来更改它

characters <- gsub("phrase", "something", characters)

此外,除非你真的需要使用拉丁字母,否则最好使用拉丁字母(ae)因为并非所有的R函数都有很好的unicode支持。

当您查找
gsub
和相关函数时,您尝试了什么?为什么不使用第一个呢?相关:我必须承认我在R中确实是一个新手。@Ananda Matho:我只是在寻找我问题的可能解决方案…@krlmlr和Ari B.Friedman…我将在ions,谢谢!难道没有一种简单的方法可以在“this”csv中对R说“just search”that,并将其替换为“that”?!:-)@Laudl007:Try
gsub('a','b','c('a','b','c'))
,如果需要,还有一个。当你查找
gsub
和相关函数时,你尝试了什么?为什么不使用第一个呢?相关:我必须承认我在R方面真的是个新手。@Ananda Matho:我只是在寻找我问题的可能解决方案…@krlmlr和Ari B.Friedman…我会查找你的建议,谢谢!是吗有一种简单的方法可以对R说“只需搜索”这个csv中的“那个”,并用“那个”替换它?!:-)@劳德2007:试试
gsub('a','b',c('a','b','c'))
,如果需要的话,还有一个。谢谢你的例子,我想我明白了。。。但这不适用于我的带有8个OB的数据帧。由两个变量组成。当我尝试'revs2=gsub('auml;','ae',revs2')时,我当然会得到一个向量。我想在我的数据框中搜索和替换。最简单的方法是一次搜索一列。revs2$varname1谢谢你的例子,我想我明白了。。。但这不适用于我的带有8个OB的数据帧。由两个变量组成。当我尝试'revs2=gsub('auml;','ae',revs2')时,我当然会得到一个向量。我想在我的数据框中搜索和替换。最简单的方法是一次搜索一列。revs2$varname1