如何在R中找到数据集的概率

如何在R中找到数据集的概率,r,R,我有一个类似的数据集,下面是一小部分。如何使用条形图计算月降雨概率 Date Rain Today 2020-01-01 Yes 2020-01-02 No 2020-01-03 Yes 2020-01-04 Yes 2020-01-05 No ... ... 2020-12-31 Yes 编辑:评论中的正确答案 我不知道你为什么要使用散点图,但是,在post中,你可以使用dplyr管道来执行以下操作:

我有一个类似的数据集,下面是一小部分。如何使用条形图计算月降雨概率

Date           Rain Today
2020-01-01     Yes
2020-01-02     No
2020-01-03     Yes
2020-01-04     Yes
2020-01-05     No
...            ...
2020-12-31     Yes

编辑:评论中的正确答案

我不知道你为什么要使用散点图,但是,在post中,你可以使用
dplyr
管道来执行以下操作:

library(dplyr)

df %>% 
  group_by(month = format(Date, "%Y-%m")) %>%
  summarise(probability = mean(`Rain Today` == 'Yes'))
df$month <- substr(df$Date, start=6, stop=7) #Get the 6th and 7th characters of your date strings, which correspond to the "month" part
tapply(df[,"Rain Today"]=="Yes", df$month, mean)
将您的数据分组为几个月,并找出已下雨/未下雨的天数。然后你就可以知道下了多少天的雨


感谢评论中的所有人指出这一点。我希望这有助于

lubridate软件包具有一些帮助您处理日期的强大功能

install.packages("lubridate")
df$month <- lubridate::month(df$Date)
tapply(df[,"Rain Today"]=="Yes", df$month, mean)

你会如何使用散点图来估计概率?我的错误,我希望它是一个条形图尝试构造一个
变量(例如
月概率永远不能是长度。那么
概率=平均值(
雨值
==“Yes”)
df%>%group\U by by(月=格式(日期,%Y-)%%>%总结(概率=平均值('Rain Today`='Yes'))