R 刮除非表信息

R 刮除非表信息,r,web-scraping,R,Web Scraping,我正试图从这个网页中获取信息,(在“第14章”标签下的信息) 然后把它放到一个数据框中,在R中有两列,但是这些技能不在我的驾驶室里,我需要一些帮助。更具体地说,我想要一列G.S.编号(“G.S.14-1”、“G.S.14-1.1”等),一列与这些G.S.编号对应的名称(“14.1重罪和轻罪定义”、“14-1.1:由1993年会议法废除,c.538,S.2”等)。作为文本而不是链接 我尝试过使用选择器小工具,但是这个工具对我来说是非常新的,我真的不知道如何在R中应用它 有什么建议或提示吗?是的,这

我正试图从这个网页中获取信息,(在“第14章”标签下的信息) 然后把它放到一个数据框中,在R中有两列,但是这些技能不在我的驾驶室里,我需要一些帮助。更具体地说,我想要一列G.S.编号(“G.S.14-1”、“G.S.14-1.1”等),一列与这些G.S.编号对应的名称(“14.1重罪和轻罪定义”、“14-1.1:由1993年会议法废除,c.538,S.2”等)。作为文本而不是链接

我尝试过使用选择器小工具,但是这个工具对我来说是非常新的,我真的不知道如何在R中应用它


有什么建议或提示吗?

是的,这相当棘手。我可能会结合使用xpath和正则表达式:

库(rvest)
#>正在加载所需的包:xml2
页