有没有什么方法可以将R中的字符编码改为英文?

有没有什么方法可以将R中的字符编码改为英文?,r,character-encoding,ropensci,tabulizer,R,Character Encoding,Ropensci,Tabulizer,在R 我使用Tabulizer库从Pdf表格中提取数据,名称是尼泊尔语 提取后我得到了这张桌子 [1] : 但现在我想改变第2列的英文名称 在R有什么方法可以做到这一点吗 我写的R代码是 library(tabulizer) location <- "https://citizenlifenepal.com/wp-content/uploads/2019/10/2nd-AGM.pdf" out <- extract_tables(location,pages =

在R 我使用Tabulizer库从Pdf表格中提取数据,名称是尼泊尔语 提取后我得到了这张桌子 [1] :

但现在我想改变第2列的英文名称

在R有什么方法可以做到这一点吗

我写的R代码是

library(tabulizer)
location <- "https://citizenlifenepal.com/wp-content/uploads/2019/10/2nd-AGM.pdf"
out <- extract_tables(location,pages = 113)
##write.table(out,file = "try.txt")
final <- do.call(rbind,out)  

final <- as.data.frame(final) ### creating df 
col_name <- c("S.No.","Types of Insurance","Inforce Policy Count", "","Sum Assured of Inforce Policies","","Sum at Risk","","Sum at Risk Transferred to Re-Insurer","","Sum At Risk Retained By Insurer","") 
names(final) <- col_name

final <- final[-1,]
write.csv(final,file = "/cloud/project/Extracted_data/Citizen_life.csv",row.names = FALSE)
View(final)```

库(tabulizer)

位置文档似乎使用了非Unicode编码。该网站可以将一些尼泊尔语编码转换为Unicode,如果加载了正确的字体,Unicode将以R正确显示。当我在你的代码输出上尝试它时,它做了一些我觉得不错的事情,但我不懂尼泊尔语:

> out[[1]][1,2]
[1] ";fjlws hLjg aLdf"
当我转换该字符串的内容时,我得到

सावधिक जीवन बीमा
在我看来,这与文档中该页上的文本类似。如果它确实写得正确,那么将它转换成英语将需要一些说尼泊尔语的人来做翻译:希望是你,但如果我使用谷歌翻译,它会

Term life insurance

所以我的建议是:联系该网站的所有者,看看他们是否能给你提供翻译规则。如果其他人找不到,请编写一个R函数来实现它们。然后手动翻译英文。

这看起来是个难题。你知道PDF文件中尼泊尔文的编码是什么吗?结果看起来像是普通的ascii码;如果文件使用UTF-8或其他Unicode编码,我不希望出现这种情况。