解析HTML表的多个文件并在R中附加到单个文件

解析HTML表的多个文件并在R中附加到单个文件,html,parsing,r,loops,Html,Parsing,R,Loops,这是我正在尝试执行的R中的一个小项目。我已经抓取了几百个html页面。我能够使用XML库中的REATHTMLTABLE函数和R来读取我感兴趣的表。但是,我在编写for循环时遇到了问题,循环遍历目录,从每个文件中获取表并将它们附加到单个CSV文件中 我已经成功地循环文件并将每个表保存到单个txt文件中(我觉得这至少是一个开始): library(XML)#htmlTreeParse parentpathwrite.table中的append=TRUE选项不应该为您提供技巧吗?您可以通过查找?wri

这是我正在尝试执行的R中的一个小项目。我已经抓取了几百个html页面。我能够使用XML库中的REATHTMLTABLE函数和R来读取我感兴趣的表。但是,我在编写for循环时遇到了问题,循环遍历目录,从每个文件中获取表并将它们附加到单个CSV文件中

我已经成功地循环文件并将每个表保存到单个txt文件中(我觉得这至少是一个开始):

library(XML)#htmlTreeParse

parentpathwrite.table中的append=TRUE选项不应该为您提供技巧吗?您可以通过查找?write.table来了解它。

您尝试过使用单个文件名
append=TRUE
吗?是的……您是对的。append=TRUE起作用。我相信我之前也尝试过,但是我忘记了代码末尾的尾随括号},没有返回任何结果。谢谢
library(XML)     # htmlTreeParse
  parentpath <- "Z:/scraping"
  setwd(parentpath)
  filenames <- list.files()
      for (targetfile in filenames){
      setwd(parentpath)
      data = readHTMLTable(targetfile)
      outputfile <- paste(targetfile,'.txt', sep="")
write.table (data[6], file = outputfile , sep = "\t", quote=TRUE)