Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/xpath/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 如何将默认UTF-8编码更改为拉丁1_R_Xpath_Encoding_Utf 8_Latin1 - Fatal编程技术网

R 如何将默认UTF-8编码更改为拉丁1

R 如何将默认UTF-8编码更改为拉丁1,r,xpath,encoding,utf-8,latin1,R,Xpath,Encoding,Utf 8,Latin1,第一次打电话。 我只想把字符串编码从UTF-8改为拉丁1。我使用Xpath从web检索数据: >library(RCurl) >library(rvest) >library(XML) >library(httr) >library(reshape2) >library(reshape) >response <- GET(paste0("http://www.visalietuva.lt/imone/jogminda-uab-telsiai-

第一次打电话。
我只想把字符串编码从UTF-8改为拉丁1。我使用Xpath从web检索数据:

>library(RCurl)  
>library(rvest)
>library(XML)
>library(httr)
>library(reshape2)
>library(reshape)

>response <- GET(paste0("http://www.visalietuva.lt/imone/jogminda-uab-telsiai-muziejaus-g-35"))
>doc <- content(response,type="text/html")
>base <- xpathSApply(doc, "//ul//li//span",xmlValue)[5]
当我检查编码时,我有UTF-8:

>Encoding(base)
[1] "UTF-8"
我想我需要拉丁1编码。因此结果将是“El.paštas”,而不是“El.paštas”

虽然当我指定拉丁1编码时,我得到了以下结果:

>base
[1] "El. paštas"
>latin <- iconv(base, from = "UTF-8", to = "LATIN1")
[1] "El. paštas"
并获得与上述相同的奇怪字符:“El.paÅtas”

任何关于如何更改编码的建议都是非常受欢迎的。谢谢。

试试看

doc <- content(response,type="text/html", encoding = "UTF-8")

doc谢谢。这回答了问题的第一部分。现在我可以使用正确的编码从url读取数据了。尽管有没有从csv读取数据的解决方案,但当csv包含此类字符时?假设我有一个带有这些奇怪符号的文件,我想用前面提到的正确编码将它读入R(使用UTF-8)。我假设它不起作用:file=read.csv(“奇怪的数据.csv”,header=F,stringsAsFactors=F,encoding=“UTF-8”)好吧,为什么不先尝试
write.table
read.table
,然后再假设一些东西呢?;-)帮助文件
?read.csv
中有一个关于编码的部分。我尝试了这些建议,但没有得到结果。代码如上图所示:#utf.csv示例数据链接:#从.csv读取中读取奇怪字符您应该通过引用示例数据发布新问题。编码错误就像打开潘多拉的盒子。。。
doc <- content(response,type="text/html", encoding = "UTF-8")