Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/77.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R:在webscraping之后将数据解析到表中_R_Web Scraping_Rvest - Fatal编程技术网

R:在webscraping之后将数据解析到表中

R:在webscraping之后将数据解析到表中,r,web-scraping,rvest,R,Web Scraping,Rvest,我能够webscrape一些数据,但在一个包含四列、空列和三列的表中格式化数据时遇到问题 library("methods") library(rvest) page <- read_html("https://www.galmarley.com/prices/CSV/AUX/USD/600/Full") page sources <- page %>%html_text() as.data.frame(sources) library(stringr) df <-

我能够webscrape一些数据,但在一个包含四列、空列和三列的表中格式化数据时遇到问题

library("methods")
library(rvest)

page <- read_html("https://www.galmarley.com/prices/CSV/AUX/USD/600/Full")
page
sources <- page %>%html_text()
as.data.frame(sources)
library(stringr)
df <- read.table(text = sources, sep = "\n")
df <- str_split_fixed(df$V1, pattern = ",", 9)
df <- as.data.frame(df)
库(“方法”)
图书馆(rvest)

页面因此对象
源代码
最终成为字符串,但幸运的是,它的格式良好。在本例中,
read.table
可以很好地将其放入单个数据帧中。然后可以使用
stringr::str_split_fixed
在分隔列的逗号上进行拆分

library("methods")
library(rvest)

page <- read_html("https://www.galmarley.com/prices/CSV/AUX/USD/600/Full")
page
sources <- page %>%html_text()
as.data.frame(sources)
library(stringr)
df <- read.table(text = sources, sep = "\n")
df <- str_split_fixed(df$V1, pattern = ",", 9)
df <- as.data.frame(df)
库(stringr)

df因此对象
最终成为一个字符串,但幸运的是它的格式很好。在本例中,
read.table
可以很好地将其放入单个数据帧中。然后可以使用
stringr::str_split_fixed
在分隔列的逗号上进行拆分

library("methods")
library(rvest)

page <- read_html("https://www.galmarley.com/prices/CSV/AUX/USD/600/Full")
page
sources <- page %>%html_text()
as.data.frame(sources)
library(stringr)
df <- read.table(text = sources, sep = "\n")
df <- str_split_fixed(df$V1, pattern = ",", 9)
df <- as.data.frame(df)
库(stringr)

df你的网站实际上不是一个页面,而是一个文档。只需在末尾添加
.csv
,然后在以下位置读取数据:

  read.csv("https://www.galmarley.com/prices/CSV/AUX/USD/600/Full.csv")
或者您可以直接阅读您拥有的:

 read.csv(text=sources)

你的网站实际上不是一个页面,而是一个文档。只需在末尾添加
.csv
,然后在以下位置读取数据:

  read.csv("https://www.galmarley.com/prices/CSV/AUX/USD/600/Full.csv")
或者您可以直接阅读您拥有的:

 read.csv(text=sources)

太好了。谢谢,太好了。非常感谢。