删除“\037“;从R中的字符串
我正在准备一个数据集,其中包含带有R的删除“\037“;从R中的字符串,r,cjk,R,Cjk,我正在准备一个数据集,其中包含带有R的CJK字符,并且主要通过Tidyverse。在这个过程中,我发现一些字符元素的末尾有\037 # A tibble: 99 × 2 Prefecture n <chr> <int> 1 \037 1 2 北海道\037 1 3 北海道 13 4 北海道 4 ... ...
CJK
字符,并且主要通过Tidyverse。在这个过程中,我发现一些字符元素的末尾有\037
# A tibble: 99 × 2
Prefecture n
<chr> <int>
1 \037 1
2 北海道\037 1
3 北海道 13
4 北海道 4
... ... ...
在字符串上测试时,str\u replace\u all
会删除所有的\037
s。但是,当对整个列应用mutate
时,上面的行在本文的第一个代码块中仍然给出相同的结果
从字符串中删除它们最有效的方法是什么
使用解决方案更新
require(stringi)
out.file %>%
mutate(Prefecture = stri_escape_unicode(Prefecture),
Prefecture = str_replace_all(Prefecture, "\037", ""),
Prefecture = stri_unescape_unicode(Prefecture))
这样我就能成功地解决问题。这可能会有帮助:谢谢@泰勒林克。这是一篇很有帮助的帖子,我能够摆脱
CJK
,替换不需要的字符,并将它们全部取消。这解决了我的问题。这可能会有帮助:谢谢@泰勒林克。这是一篇很有帮助的帖子,我能够摆脱CJK
,替换不需要的字符,并将它们全部取消。这解决了我的问题。
require(stringi)
out.file %>%
mutate(Prefecture = stri_escape_unicode(Prefecture),
Prefecture = str_replace_all(Prefecture, "\037", ""),
Prefecture = stri_unescape_unicode(Prefecture))