删除R中所有非拉丁字符

删除R中所有非拉丁字符,r,string,tm,R,String,Tm,这里有两条线 *3472459 PIVO 何か-何か-何か/100х1,5g *3472459 VINO 何か何か何か100х1,5g 如何删除所有非拉丁字符? 输出应该是 PIVO Vino 给定文本中的文本字符串,str\u extractfrom stringr或stri\u extractfrom stringi返回预期结果 text <- c("*3472459 PIVO 何か-何か-何か/100х1,5g", "*3472459 VINO 何か何か何か

这里有两条线

*3472459 PIVO 何か-何か-何か/100х1,5g

*3472459 VINO 何か何か何か100х1,5g
如何删除所有非拉丁字符? 输出应该是

PIVO
Vino

给定文本中的文本字符串,
str\u extract
from stringr或
stri\u extract
from stringi返回预期结果

text <- c("*3472459 PIVO 何か-何か-何か/100х1,5g",
          "*3472459 VINO 何か何か何か100х1,5g")

stringr::str_extract(text, "[:alpha:]+")
[1] "PIVO" "VINO"

stringi::stri_extract(text, regex = "[:alpha:]+")
[1] "PIVO" "VINO"

text给定text中的文本字符串,
str\u extract
from stringr或
stri\u extract
from stringi返回预期结果

text <- c("*3472459 PIVO 何か-何か-何か/100х1,5g",
          "*3472459 VINO 何か何か何か100х1,5g")

stringr::str_extract(text, "[:alpha:]+")
[1] "PIVO" "VINO"

stringi::stri_extract(text, regex = "[:alpha:]+")
[1] "PIVO" "VINO"

text是否要删除日文字符?或者只保留pivo/vino(波兰语?),因为删除所有非拉丁字符会留下“*3472459 pivo/100 imk 1,5g”@phiver字符可以是日语、西里尔语等。拉丁语可以是波兰语,英语。理想情况下,让纯单词没有数字和表示度量的字母(g是gram),如果不可能的话,让我们简单一点。“*3472459 PIVO/100 imk 1,5g”是否要删除日文字符?或者只保留pivo/vino(波兰语?),因为删除所有非拉丁字符会留下“*3472459 pivo/100 imk 1,5g”@phiver字符可以是日语、西里尔语等。拉丁语可以是波兰语,英语。理想情况下,让纯单词没有数字和表示度量的字母(g是gram),如果不可能的话,让我们简单一点。“*3472459 PIVO/100 crmk_1,5g”