Html 在R中使用新文件名输出文件

Html 在R中使用新文件名输出文件,html,r,xml,rcurl,Html,R,Xml,Rcurl,我使用R获取这些网页的XML文件。我有一个csv文件,它有6000个网页链接,我有一个for循环,它通过每个网页链接运行,并获取每个网页链接的XML 现在,我需要创建6000个单独的XML文件输出。我需要把它们贴上“1页”到“6000页”的标签 以下是我正在使用的代码: hf_file <- trial_href_file hf_file$Href <- as.character(hf_file$Href) for (i in 1:nrow(hf_file)) { url2 = h

我使用R获取这些网页的XML文件。我有一个csv文件,它有6000个网页链接,我有一个
for
循环,它通过每个网页链接运行,并获取每个网页链接的XML

现在,我需要创建6000个单独的XML文件输出。我需要把它们贴上“1页”到“6000页”的标签

以下是我正在使用的代码:

hf_file <- trial_href_file
hf_file$Href <- as.character(hf_file$Href)

for (i in 1:nrow(hf_file))
{
url2 = hf_file$Href[i]
h21 = GET(url2,user_agent("Gigabot/3.0    (http://www.gigablast.com/spider.html)"))%>% read_html()
data <- xmlParse(h21)
saved_html<- saveXML(data)
#write.csv(paste0(saved_html,i), file = "test.csv")
write.table(saved_html, file=paste0("C:/Users/keerthana.j/Documents/Car Database/Data", Sys.Time(), ".txt"))
#write.table(saved_html, "page_html.txt", sep=",", append = TRUE)
} 

hf\u文件你想要什么?您已经将时间粘贴到名称中,在日期和.txt之间添加
,i
有多复杂?也可以跳过所有中间步骤,只使用下载.file。(a)您是gigablast的员工或授权代表吗?如果不是,使用该用户代理最多也就是skeezy(在道德和法律上与使用mozilla-ish代理有很大不同)(b)我看不到任何代码支持您先检查
robots.txt
(via)的说法;你…吗?(c) 缺少示例URL通常表示删除私有内部网络(这很好)或行为不道德。(d) 最后,坦西拜是对的。如果数字标识符不够,那么您是否在R中搜索生成唯一ID?