R 粘贴由电话号码组成的字符串时的奇怪行为
我从WhatsApp聊天中提取了数据(R 粘贴由电话号码组成的字符串时的奇怪行为,r,stringr,R,Stringr,我从WhatsApp聊天中提取了数据(df),并构建了一个名为name的变量。现在,在某些情况下,我没有名字,只有电话号码 因此,在下一步中,我尝试为每个数字指定一个名称。现在,R显示出一种奇怪的行为(对不起,我不知道这个的其他名称): 当我键入哪个(df$name==”时+49 176 12345678")在控制台中,R以某种方式将其更改为(df$name==“*+49 176 12345678”)(然后,当然,找不到这个数字的任何实例)。同时,似乎有一个“看不见的空格”:当我的光标直接位
df
),并构建了一个名为name
的变量。现在,在某些情况下,我没有名字,只有电话号码
因此,在下一步中,我尝试为每个数字指定一个名称。现在,R显示出一种奇怪的行为(对不起,我不知道这个的其他名称):
当我键入哪个(df$name==”时+49 176 12345678")
在控制台中,R以某种方式将其更改为(df$name==“*+49 176 12345678”)
(然后,当然,找不到这个数字的任何实例)。同时,似乎有一个“看不见的空格”:当我的光标直接位于“8”的右侧,我按backspace时,“7”被删除
如果这样有帮助:当查看变量(
View(df$name)
)时,R不会显示像+49 176 12345678这样的数字代码>,但+49 176 12345678代码>。但是,这些unicode控制字符在使用(例如)``表(df$name)时不会出现`.尝试使用此处建议的方法剥离非ASCII字符:gist.github.com/nassimhaddad/4643587。正如您所确定的,您遇到的问题似乎是字符串中有一些隐藏字符。它们会产生各种奇怪的行为。运行df$text尝试使用这里建议的方法是:gist.github.com/nassimhaddad/4643587。看起来您遇到的问题是,正如您所确定的,字符串中有一些隐藏字符。它们正在创建各种奇怪的行为。运行df$text与stringr
有什么联系?此外,我们复制这种行为的方法是e很好。尝试使用此处建议的方法剥离非ASCII字符:。n.m.,不起作用因为我们无法复制您的问题,您能否尝试gsub(“[^0-9]”,“,”,x)
其中x是df$name?我们的想法是尝试从字符串中删除任何非数字或空格。我只是给出了一个答案。我很高兴它对您有效!与stringr
有什么联系?另外,我们有一种复制此行为的方法会很好。尝试使用此处建议的方法剥离非ASCII字符:.n.m.,不起作用ce我们无法复制您的问题,您能否尝试gsub(“[^0-9]”,“,”,x)
其中x是df$name?我们的想法是尝试从字符串中删除任何非数字或空格。我只是做了一个回答。我很高兴它对您有效!您知道问题的原因是什么吗?只是为了让我进一步了解您刚刚解决的问题?我认为是隐藏字符。您的解释完全正确,并且olution只是去除了那些隐藏的字符。这不是一个答案,它是一个资源的url。好的,谢谢。我是这个网站的新手,不懂礼仪。我可以通过详细说明将它变成一个答案吗?还是我应该删除它?详细说明,也许解释隐藏的字符。主要的一点是,即使是git,它仍然应该是一个有用的帖子我们将消失。你知道问题的原因是什么吗?只是为了让我进一步了解你刚刚解决的问题?我认为是隐藏字符。你的解释完全正确,解决方案只是去除了这些隐藏字符。这不是答案,而是资源的url。好的,谢谢。我是新手我不知道网站的礼仪。我可以通过详细说明将其变成一个答案吗?或者我应该删除它吗?详细说明,也许解释隐藏的字符。主要的一点是,即使github的要点消失了,它仍然应该是一个有用的帖子。