日语的urlquery。编码问题?
我正在尝试读取以下CSV文件,其中包含R中的日语和英语文本,构建URL并检索结果 数据如下所示日语的urlquery。编码问题?,r,encoding,utf-8,R,Encoding,Utf 8,我正在尝试读取以下CSV文件,其中包含R中的日语和英语文本,构建URL并检索结果 数据如下所示 ID,AutoG1,AutoG2 8756,Pocket Card,ポケットカード 4574,Takara Standard,タカラスタンダード 我试图运行的代码如下: >library(XML) >library(RCurl) > >data<-read.csv("test.csv") >url <- paste("suggestqueries.googl
ID,AutoG1,AutoG2
8756,Pocket Card,ポケットカード
4574,Takara Standard,タカラスタンダード
我试图运行的代码如下:
>library(XML)
>library(RCurl)
>
>data<-read.csv("test.csv")
>url <- paste("suggestqueries.google.com/complete/search?output=toolbar&hl=jp&qu=",data[1,"AutoG2"],sep="")
>url
"suggestqueries.google.com/complete/search?output=toolbar&hl=jp&qu=ポケットカード"
>result <-getURL(URLencode(url),.opts=opts)
>doc <- xmlRoot(xmlTreeParse(result))
>length(zzdoc)
0
我曾试图这样强制编码
> Encoding(url)<-"UTF-8"
> url
"suggestqueries.google.com/complete/search?output=toolbar&hl=jp&qu=\u0083|\u0083P\u0083b\u0083g\u0083J\u0081[\u0083h"
> zz <-getURL(URLencode(url),.opts=opts)
Warning message:
In strsplit(URL, "") : input string 1 is invalid UTF-8
>编码(url)url
“suggestqueries.google.com/complete/search?output=toolbar&hl=jp&qu=\u0083 |\u0083P\u0083b\u0083g\u0083J\u0081[\u0083h”
>zz我认为您需要包含代码使用的“http://”
url <- paste("http://suggestqueries.google.com/complete/search?output=toolbar&hl=jp&qu=",data[1,"AutoG2"],sep="")
url
> Encoding(url)<-"UTF-8"
> url
"suggestqueries.google.com/complete/search?output=toolbar&hl=jp&qu=\u0083|\u0083P\u0083b\u0083g\u0083J\u0081[\u0083h"
> zz <-getURL(URLencode(url),.opts=opts)
Warning message:
In strsplit(URL, "") : input string 1 is invalid UTF-8
url <- paste("http://suggestqueries.google.com/complete/search?output=toolbar&hl=jp&qu=",data[1,"AutoG2"],sep="")