Html 如何处理将列绑定到数据框时缺少行的问题(一个刮取问题!)

Html 如何处理将列绑定到数据框时缺少行的问题(一个刮取问题!),html,r,xml,web-scraping,mapply,Html,R,Xml,Web Scraping,Mapply,我试图通过将URL附加到一个已删除的HTML表,然后将这些URL写入单个csv文件来创建数据帧。这些数据与下议院和上议院通过法案的各个阶段有关。我已经编写了一个函数(见下文),它读取表格,解析HTML代码,刮取所需的URL,将两者绑定在一起,提取与上议院相关的行,然后写入csv文件。然后,该函数在两个列表中运行(一个是指向Bill stage页面的链接,另一个是简化文件名的链接) 例如,在“三读:下议院”和“皇室同意”两次会议上均未进行辩论。这将导致返回以下错误: Error in da

我试图通过将URL附加到一个已删除的HTML表,然后将这些URL写入单个csv文件来创建数据帧。这些数据与下议院和上议院通过法案的各个阶段有关。我已经编写了一个函数(见下文),它读取表格,解析HTML代码,刮取所需的URL,将两者绑定在一起,提取与上议院相关的行,然后写入csv文件。然后,该函数在两个列表中运行(一个是指向Bill stage页面的链接,另一个是简化文件名的链接)

例如,在“三读:下议院”和“皇室同意”两次会议上均未进行辩论。这将导致返回以下错误:

    Error in data.frame(..., check.names = FALSE) : 
     arguments imply differing number of rows: 21, 19
在克服这个错误的过程中,我希望对缺失的阶段有一个NA。有人知道如何做到这一点吗?我是n00b的亲戚,所以请随意提出一种更优雅的方法来解决整个问题


提前谢谢

您可能会发现这很有帮助:或者在表的大小为0时执行if/else?关键是获取一组祖先标记,每个标记包含您感兴趣的两个内容,然后迭代这些标记,获取您想要的两个部分,然后在最后执行
rbind
ing。如果您进行搜索,会有很多示例,尽管很多示例使用rvest而不是XML包。谢谢。我一直在寻找答案,因为我很确定这是一个常见的问题,但我不知道如何用词搜索这个词!使用rvest的解决方案看起来更有希望。
    browseURL("http://services.parliament.uk/bills/2010-12/armedforces/stages.html")
    Error in data.frame(..., check.names = FALSE) : 
     arguments imply differing number of rows: 21, 19