R:在webscraping之后将数据解析到表中
我能够webscrape一些数据,但在一个包含四列、空列和三列的表中格式化数据时遇到问题R:在webscraping之后将数据解析到表中,r,web-scraping,rvest,R,Web Scraping,Rvest,我能够webscrape一些数据,但在一个包含四列、空列和三列的表中格式化数据时遇到问题 library("methods") library(rvest) page <- read_html("https://www.galmarley.com/prices/CSV/AUX/USD/600/Full") page sources <- page %>%html_text() as.data.frame(sources) library(stringr) df <-
library("methods")
library(rvest)
page <- read_html("https://www.galmarley.com/prices/CSV/AUX/USD/600/Full")
page
sources <- page %>%html_text()
as.data.frame(sources)
library(stringr)
df <- read.table(text = sources, sep = "\n")
df <- str_split_fixed(df$V1, pattern = ",", 9)
df <- as.data.frame(df)
库(“方法”)
图书馆(rvest)
页面因此对象源代码最终成为字符串,但幸运的是,它的格式良好。在本例中,read.table
可以很好地将其放入单个数据帧中。然后可以使用stringr::str_split_fixed
在分隔列的逗号上进行拆分
library("methods")
library(rvest)
page <- read_html("https://www.galmarley.com/prices/CSV/AUX/USD/600/Full")
page
sources <- page %>%html_text()
as.data.frame(sources)
library(stringr)
df <- read.table(text = sources, sep = "\n")
df <- str_split_fixed(df$V1, pattern = ",", 9)
df <- as.data.frame(df)
库(stringr)
df因此对象源最终成为一个字符串,但幸运的是它的格式很好。在本例中,read.table
可以很好地将其放入单个数据帧中。然后可以使用stringr::str_split_fixed
在分隔列的逗号上进行拆分
library("methods")
library(rvest)
page <- read_html("https://www.galmarley.com/prices/CSV/AUX/USD/600/Full")
page
sources <- page %>%html_text()
as.data.frame(sources)
library(stringr)
df <- read.table(text = sources, sep = "\n")
df <- str_split_fixed(df$V1, pattern = ",", 9)
df <- as.data.frame(df)
库(stringr)
df你的网站实际上不是一个页面,而是一个文档。只需在末尾添加.csv
,然后在以下位置读取数据:
read.csv("https://www.galmarley.com/prices/CSV/AUX/USD/600/Full.csv")
或者您可以直接阅读您拥有的:
read.csv(text=sources)
你的网站实际上不是一个页面,而是一个文档。只需在末尾添加.csv
,然后在以下位置读取数据:
read.csv("https://www.galmarley.com/prices/CSV/AUX/USD/600/Full.csv")
或者您可以直接阅读您拥有的:
read.csv(text=sources)
太好了。谢谢,太好了。非常感谢。