从webscraper更改R中的日期,但无法转换
我试图完成一个问题,从两个数据集中提取需要合并到一个数据集中的数据。为了达到这一点,我需要按年份和月份信息来检索这两个数据集。不幸的是,第一个数据集需要按年-月信息进行统计,我似乎不知道如何更改日期,以便可以使用月-年信息而不是月-日-年信息。 这是关于雪崩的数据,我需要编写代码,计算雪季(定义为12-3月)每个月的雪崩总数。我该怎么做 我一直试图将日期格式转换为月份-年份,但在我用从webscraper更改R中的日期,但无法转换,r,R,我试图完成一个问题,从两个数据集中提取需要合并到一个数据集中的数据。为了达到这一点,我需要按年份和月份信息来检索这两个数据集。不幸的是,第一个数据集需要按年-月信息进行统计,我似乎不知道如何更改日期,以便可以使用月-年信息而不是月-日-年信息。 这是关于雪崩的数据,我需要编写代码,计算雪季(定义为12-3月)每个月的雪崩总数。我该怎么做 我一直试图将日期格式转换为月份-年份,但在我用 as.Date(avalancheslc$Date, format="%y-%m") Date的所有值都将转到
as.Date(avalancheslc$Date, format="%y-%m")
Date的所有值都将转到NA的…帮助
# write the webscraper
library(XML)
library(RCurl)
avalanche<-data.frame()
avalanche.url<-"https://utahavalanchecenter.org/observations?page="
all.pages<-0:202
for(page in all.pages){
this.url<-paste(avalanche.url, page, sep=" ")
this.webpage<-htmlParse(getURL(this.url))
thispage.avalanche<-readHTMLTable(this.webpage, which=1, header=T)
avalanche<-rbind(avalanche,thispage.avalanche)
}
# subset the data to the Salt Lake Region
avalancheslc<-subset(avalanche, Region=="Salt Lake")
str(avalancheslc)
avalancheslc$monthyear<-format(as.Date(avalancheslc$Date),"%Y-%m")
# How can I tally the number of avalanches?
这应该行得通(我只在1页上试过,不是全部203页)。注意在readHTMLTable
函数中使用了选项stringsAsFactors=F
,并且需要添加名称,因为1列不会自动获得名称
library(XML)
library(RCurl)
library(dplyr)
avalanche <- data.frame()
avalanche.url <- "https://utahavalanchecenter.org/observations?page="
all.pages <- 0:202
for(page in all.pages){
this.url <- paste(avalanche.url, page, sep=" ")
this.webpage <- htmlParse(getURL(this.url))
thispage.avalanche <- readHTMLTable(this.webpage, which = 1, header = T,
stringsAsFactors = F)
names(thispage.avalanche) <- c('Date','Region','Location','Observer')
avalanche <- rbind(avalanche,thispage.avalanche)
}
avalancheslc <- subset(avalanche, Region == "Salt Lake")
str(avalancheslc)
avalancheslc <- mutate(avalancheslc, Date = as.Date(Date, format = "%m/%d/%Y"),
monthyear = paste(year(Date), month(Date), sep = "-"))
库(XML)
图书馆(RCurl)
图书馆(dplyr)
雪崩这应该行得通(我只在1页上试过,不是全部203页)。注意在readHTMLTable
函数中使用了选项stringsAsFactors=F
,并且需要添加名称,因为1列不会自动获得名称
library(XML)
library(RCurl)
library(dplyr)
avalanche <- data.frame()
avalanche.url <- "https://utahavalanchecenter.org/observations?page="
all.pages <- 0:202
for(page in all.pages){
this.url <- paste(avalanche.url, page, sep=" ")
this.webpage <- htmlParse(getURL(this.url))
thispage.avalanche <- readHTMLTable(this.webpage, which = 1, header = T,
stringsAsFactors = F)
names(thispage.avalanche) <- c('Date','Region','Location','Observer')
avalanche <- rbind(avalanche,thispage.avalanche)
}
avalancheslc <- subset(avalanche, Region == "Salt Lake")
str(avalancheslc)
avalancheslc <- mutate(avalancheslc, Date = as.Date(Date, format = "%m/%d/%Y"),
monthyear = paste(year(Date), month(Date), sep = "-"))
库(XML)
图书馆(RCurl)
图书馆(dplyr)
雪崩成功了!非常感谢。你能帮我弄清楚如何将每个月的数据相加成一个数据帧吗?你说的“将每个月的数据相加成一个数据帧”的意思是:as_tible(with(avalanchslc,table(monthyear))
?现在当我运行代码时,我发现了一个新的错误saing“error in mutat\u impl(.data,dots):评估错误:找不到函数“year”。我不记得year
函数来自哪个包,所以我在谷歌上搜索了“R函数year”,“这表明它来自于lubridate
软件包,我一直在加载该软件包。我强烈推荐它处理日期和时间。这很有效!非常感谢。你能帮我弄清楚如何将每个月的数据相加成一个数据帧吗?你说的“将每个月的数据相加成一个数据帧”的意思是:as_tible(with(avalanchslc,table(monthyear))
?现在当我运行代码时,我发现了一个新的错误saing“error in mutat\u impl(.data,dots):评估错误:找不到函数“year”。我不记得year
函数来自哪个软件包,所以我在谷歌上搜索了“R function year”,结果显示它来自lubridate
软件包,我总是加载该软件包。我强烈推荐它用于处理日期和时间。