有没有办法合并这些行?html抓取
正在为作业抓取网页时遇到问题。我用以下语法将12个网页拼凑成一个文档:有没有办法合并这些行?html抓取,html,r,bind,screen-scraping,Html,R,Bind,Screen Scraping,正在为作业抓取网页时遇到问题。我用以下语法将12个网页拼凑成一个文档: for(i沿(qb_url)顺序排列) { qb_数据% rawToChar()%>% htmlParse()%>% readHTMLTable(stringsAsFactors=FALSE)%>% 抽提物2(1)%>% 绑定_行(qb_数据) }以下是一些虚拟数据 library(tidyverse) df <- tibble( player = rep(c("Alice", "
for(i沿(qb_url)顺序排列)
{
qb_数据%
rawToChar()%>%
htmlParse()%>%
readHTMLTable(stringsAsFactors=FALSE)%>%
抽提物2(1)%>%
绑定_行(qb_数据)
}
以下是一些虚拟数据
library(tidyverse)
df <- tibble(
player = rep(c("Alice", "Bob", "Carol"), each = 3),
x = rep(c(1, NA, NA), times = 3),
y = rep(c(NA, 1, NA), times = 3),
z = rep(c(NA, NA, 1), times = 3)
)
df
#> # A tibble: 9 x 4
#> player x y z
#> <chr> <dbl> <dbl> <dbl>
#> 1 Alice 1 NA NA
#> 2 Alice NA 1 NA
#> 3 Alice NA NA 1
#> 4 Bob 1 NA NA
#> 5 Bob NA 1 NA
#> 6 Bob NA NA 1
#> 7 Carol 1 NA NA
#> 8 Carol NA 1 NA
#> 9 Carol NA NA 1
没有提供qb_url,以便生成废品。抱歉,我以前的代码中提供了它。如果您需要,我可以提供它…这可能会帮助您更好地了解发生了什么。
url抱歉,我真的很难设置格式。。。但是qb_url
df %>%
group_by(player) %>%
summarise(across(everything(), ~first(na.omit(.))))
#> # A tibble: 3 x 4
#> player x y z
#> <chr> <dbl> <dbl> <dbl>
#> 1 Alice 1 1 1
#> 2 Bob 1 1 1
#> 3 Carol 1 1 1