尝试使用dplyr和rvest解析多个HTML。需要帮助简化循环吗
我试图解析多个URL并创建一个数据帧。简化代码有困难。有人能指导我把所有的东西都放在一个循环中吗 我使用rvest::read_html将5个URL读入列表,如下所示:尝试使用dplyr和rvest解析多个HTML。需要帮助简化循环吗,r,loops,dplyr,rvest,R,Loops,Dplyr,Rvest,我试图解析多个URL并创建一个数据帧。简化代码有困难。有人能指导我把所有的东西都放在一个循环中吗 我使用rvest::read_html将5个URL读入列表,如下所示: list_1 <- read_html(url_1) list_2 <- read_html(url_2) list_3 <- read_html(url_3) list_4 <- read_html(url_4) list_5 <- read_html(url_5) 我尝试了一些paste()和
list_1 <- read_html(url_1)
list_2 <- read_html(url_2)
list_3 <- read_html(url_3)
list_4 <- read_html(url_4)
list_5 <- read_html(url_5)
我尝试了一些paste()和assign()的变体,试图用“\u I”替换_1、_2、_3等,但一直碰壁
帮助学习正确使用。你能做一个reprex吗?你能做一个reprex吗?
## Get data
ZipCode_1 <- list_1 %>%
html_nodes(".horizontal .horizontal .vertical .vertical .formfield:nth-child(1) .value") %>%
html_text()
Units_1 <- list_1 %>%
html_nodes(".horizontal .horizontal .vertical .vertical .formfield+ .formfield .value") %>%
html_text()
Size_1 <- listing_1 %>%
html_nodes(".horizontal .horizontal .horizontal+ .horizontal .formfield:nth-child(1) .value") %>%
html_text()
## Create dataframe
list_df_1 <- data.frame(ZipCode_1, Units_1, Size_1, stringsAsFactors = FALSE)
## Add this back to a main list
colnames(list_df_1) <- colnames(list_df)
list_df <- rbind(list_df, list_df_1)
for (i in 1:5) {
## above code block
}