R:使用RSelenium通过文本捕获罢工
我正在使用RSelenium从网站上刮取数据表。使用循环遍历多个页面 下面的代码成功地刮取了有问题的表(尽管没有UTFC格式),但是在某些情况下,表中的条目有一个“打通”,在这种情况下,忽略打通的代码并在不存在的情况下执行操作 例如: 但R中的记录为 当我擦桌子时,谁能帮助我如何通过信息保留罢工信息 我的代码刮表:R:使用RSelenium通过文本捕获罢工,r,web-scraping,html-table,rselenium,R,Web Scraping,Html Table,Rselenium,我正在使用RSelenium从网站上刮取数据表。使用循环遍历多个页面 下面的代码成功地刮取了有问题的表(尽管没有UTFC格式),但是在某些情况下,表中的条目有一个“打通”,在这种情况下,忽略打通的代码并在不存在的情况下执行操作 例如: 但R中的记录为 当我擦桌子时,谁能帮助我如何通过信息保留罢工信息 我的代码刮表: Data_table_html <- remDr$getPageSource()[[1]] %>%
Data_table_html <- remDr$getPageSource()[[1]] %>%
read_html() %>%
html_table(header = FALSE, fill = TRUE)
Data\u table\u html%
读取html()%>%
html_表格(标题=FALSE,填充=TRUE)
我花了几个小时在这上面,所以任何帮助或指点都会非常有用,我想在下面分享我找到的解决方案。简言之,在HTML中识别将HTML_attr作为“样式”的节点可以实现以下目的:
保存%html\u attr(“style”)%%>%gsub(“文本装饰:行通过;”,“0”,)#%>%html\u表格(fill=TRUE)
我想在下面分享我找到的解决方案。简言之,在HTML中识别将HTML_attr作为“样式”的节点可以实现以下目的:
saving%html\u attr(“style”)%%>%gsub(“文本装饰:行通过;”,“0”,)#%>%html\u表(fill=TRUE)
您能分享url或html代码的一部分吗?我想分享我在下面找到的解决方案。简言之,在HTML中识别将HTML属性作为“样式”的节点的诀窍是:保存%HTML属性(“样式”)%%>%gsub(“文本装饰:行通过;”,“0”,)#%>%HTML\U表格(fill=TRUE)很好!!如果您找到了解决方案,我建议您在下面的答案框中共享。您可以共享url或html代码的一部分吗?我想在下面共享我找到的解决方案。简言之,在HTML中识别将HTML属性作为“样式”的节点的诀窍是:保存%HTML属性(“样式”)%%>%gsub(“文本装饰:行通过;”,“0”,)#%>%HTML\U表格(fill=TRUE)很好!!如果你找到了解决方案,我建议你在下面的答案框中分享。