如何从r中的字符串中删除以下unicode?
我有以下字符串如何从r中的字符串中删除以下unicode?,r,regex,R,Regex,我有以下字符串700775648448000000075648448 我想删除700775648448000000和逗号 我一直在尝试其他人在这里展示的不同方式,但我不明白。如果有人能帮忙,我们将不胜感激 可能存在语言障碍,无法表达明确的问题,但如果我正在阅读请求,则需要从该字符串中删除“700775648448000000”和“,”。regex函数gsub的第一个参数(模式)将在模式字符串中写入逻辑OR时作为“|”,因此我们可以将任何此类实例替换为”: >x gsub(“70077564844
700775648448000000075648448
我想删除
700775648448000000
和逗号我一直在尝试其他人在这里展示的不同方式,但我不明白。如果有人能帮忙,我们将不胜感激 可能存在语言障碍,无法表达明确的问题,但如果我正在阅读请求,则需要从该字符串中删除“700775648448000000”和“,”。regex函数
gsub
的第一个参数(模式)将在模式字符串中写入逻辑OR时作为“|”
,因此我们可以将任何此类实例替换为”
:
>x gsub(“700775648448000000,”,“”,x)
[1] "75648448"
对于修改后的问题(如果这确实是字符串在R中显示时的样子),您可以使用以下命令删除所有内容,包括右括号和逗号:
gsub("(^.+>)|,", # match either a comma or (everything from start to the ">")
"", # replace with empty string
"7007756484480000000<U+2660>75,648,448") # the input
gsub((^.+>)|,“,#匹配逗号或(从开始到“>”的所有内容)
“”,#替换为空字符串
“700775648448000000075648448”)#输入
真正的Unicode字符如下所示:
z <- "\U2660"
nchar(z)
#[1] 1
# whereas you just have ordinary characters
z <- "<U+2660>"
nchar(z)
#[1] 8
z发布的问题似乎根本不包括解决问题的方法。StackOverflow希望您能这样做,因为您的尝试有助于我们更好地了解您的需求。请编辑问题以显示您已尝试的内容,以便说明您遇到的具体障碍。有关更多信息,请参阅并获取。好吧,问题出在这里。这不是R字符串中的Unicode字符。因此,学习如何删除“真正的”R Unicode字符并没有帮助。您应该发布dput(x)
的输出,其中x是R对象的名称。这不是一个公平的审计问题。对不起。我是新来的。我已经解决了这个问题。还是非常感谢你的回答!非常感谢你!我真的很感激!
z <- "\U2660"
nchar(z)
#[1] 1
# whereas you just have ordinary characters
z <- "<U+2660>"
nchar(z)
#[1] 8
z <- "\U2660"
z
#[1] "♠"
gsub("\\U2660","",z)
#[1] "♠"
gsub("\\U2660","",z)
#[1] "♠"
#Method 1
gsub("[\U2660]","",z)
#[1] ""
#Method 2
gsub("\\\U2660","",z)
#[1] ""