Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/74.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R:使用RSelenium通过文本捕获罢工_R_Web Scraping_Html Table_Rselenium - Fatal编程技术网

R:使用RSelenium通过文本捕获罢工

R:使用RSelenium通过文本捕获罢工,r,web-scraping,html-table,rselenium,R,Web Scraping,Html Table,Rselenium,我正在使用RSelenium从网站上刮取数据表。使用循环遍历多个页面 下面的代码成功地刮取了有问题的表(尽管没有UTFC格式),但是在某些情况下,表中的条目有一个“打通”,在这种情况下,忽略打通的代码并在不存在的情况下执行操作 例如: 但R中的记录为 当我擦桌子时,谁能帮助我如何通过信息保留罢工信息 我的代码刮表: Data_table_html <- remDr$getPageSource()[[1]] %>%

我正在使用RSelenium从网站上刮取数据表。使用循环遍历多个页面

下面的代码成功地刮取了有问题的表(尽管没有UTFC格式),但是在某些情况下,表中的条目有一个“打通”,在这种情况下,忽略打通的代码并在不存在的情况下执行操作

例如:

但R中的记录为

当我擦桌子时,谁能帮助我如何通过信息保留罢工信息

我的代码刮表:

Data_table_html <- remDr$getPageSource()[[1]] %>% 
                                  read_html() %>%
                                  html_table(header = FALSE, fill = TRUE)
Data\u table\u html%
读取html()%>%
html_表格(标题=FALSE,填充=TRUE)

我花了几个小时在这上面,所以任何帮助或指点都会非常有用,

我想在下面分享我找到的解决方案。简言之,在HTML中识别将HTML_attr作为“样式”的节点可以实现以下目的:


保存%html\u attr(“style”)%%>%gsub(“文本装饰:行通过;”,“0”,)#%>%html\u表格(fill=TRUE)

我想在下面分享我找到的解决方案。简言之,在HTML中识别将HTML_attr作为“样式”的节点可以实现以下目的:


saving%html\u attr(“style”)%%>%gsub(“文本装饰:行通过;”,“0”,)#%>%html\u表(fill=TRUE)

您能分享url或html代码的一部分吗?我想分享我在下面找到的解决方案。简言之,在HTML中识别将HTML属性作为“样式”的节点的诀窍是:保存%HTML属性(“样式”)%%>%gsub(“文本装饰:行通过;”,“0”,)#%>%HTML\U表格(fill=TRUE)很好!!如果您找到了解决方案,我建议您在下面的答案框中共享。您可以共享url或html代码的一部分吗?我想在下面共享我找到的解决方案。简言之,在HTML中识别将HTML属性作为“样式”的节点的诀窍是:保存%HTML属性(“样式”)%%>%gsub(“文本装饰:行通过;”,“0”,)#%>%HTML\U表格(fill=TRUE)很好!!如果你找到了解决方案,我建议你在下面的答案框中分享。