R 创建散点图以显示相关性
我试图用我的大数据集创建一个散点图,显示湿度和降雨量之间的相关性。然而,我认为如果我使用一个月内某个特定地点的平均湿度和降雨量之和,相关性会更好,因为现在每天的降雨量数据点为零,因为大多数天都不下雨 问题是,我不确定如何计算一年零一个月内几天的降雨值,同样也不确定如何计算平均湿度。然后通过这样做得到两个相应的数据点(月平均湿度:月降雨量之和)用于散点图 数据集的小示例:最后一列是湿度,第二列是最后一次降雨,第一列是日期R 创建散点图以显示相关性,r,R,我试图用我的大数据集创建一个散点图,显示湿度和降雨量之间的相关性。然而,我认为如果我使用一个月内某个特定地点的平均湿度和降雨量之和,相关性会更好,因为现在每天的降雨量数据点为零,因为大多数天都不下雨 问题是,我不确定如何计算一年零一个月内几天的降雨值,同样也不确定如何计算平均湿度。然后通过这样做得到两个相应的数据点(月平均湿度:月降雨量之和)用于散点图 数据集的小示例:最后一列是湿度,第二列是最后一次降雨,第一列是日期 谢谢,非常感谢您提供的任何帮助如果没有数据,我建议您使用dplyr软件包
谢谢,非常感谢您提供的任何帮助如果没有数据,我建议您使用
dplyr
软件包的groupby()
函数按月分组,然后使用summary()
计算平均值和总湿度值
编辑:我在澳大利亚政府气象局网站上追踪了过去13个月的降雨量和下午3点的相对湿度数据 我分别使用
data.table
和tidyverse
包进行数据摄取和数据清理。以下是我使用的代码:
library(data.table)
library(tidyverse)
df <- as_tibble(fread('IDCJDW2125.csv'))
df <- add_column(df, Month = format(as.Date(df$Date), '%B %Y'), .after = 'Date') %>%
group_by(Month) %>%
summarize(sum(`Rainfall (mm)`), mean(`3pm relative humidity (%)`))
colnames(df)[2:3] <- c('Total Rainfall (mm)', 'Average 3 PM Relative Humidity (%)')
ggplot(df, aes(x = `Total Rainfall (mm)`, y = `Average 3 PM Relative Humidity (%)`)) +
geom_point()
库(data.table)
图书馆(tidyverse)
df%
汇总(总和(`降雨量(mm)`),平均值(`3pm相对湿度(%)`))
colnames(df)[2:3]请不要将代码或数据作为图像发布。使用纯文本,以便其他用户可以复制/粘贴。您可以使用dput()
和/或head()
来获取数据,代码可以缩进4个空格。非常感谢您的精彩回复,我正在获取新包,但是我该如何在散点图中添加回归线呢?
# A tibble: 6 x 21
Date `Minimum temper~ `Maximum temper~ `Rainfall (mm)` `Evaporation (m~ `Sunshine (hour~ `Direction of m~ `Speed of maxim~ `Time of maximu~ `9am Temperatur~
<chr> <dbl> <dbl> <dbl> <dbl> <dbl> <chr> <int> <chr> <dbl>
1 2018~ 9.2 21.4 0 4 9.6 WSW 41 15:42 15.7
2 2018~ 9.1 19 0 5.2 7.9 ENE 33 14:48 14.1
3 2018~ 9.4 23.4 0 2 9.5 WNW 57 23:07 15
4 2018~ 11.3 20.7 0 5.2 8.6 WNW 54 9:56 15.5
5 2018~ 6.9 20.9 0 5.6 10.3 NE 41 16:38 12.6
6 2018~ 11.9 19.7 0 4 4 NW 69 15:16 13.6
# ... with 11 more variables: `9am relative humidity (%)` <int>, `9am cloud amount (oktas)` <int>, `9am wind direction` <chr>, `9am wind speed (km/h)` <int>, `9am
# MSL pressure (hPa)` <dbl>, `3pm Temperature (°C)` <dbl>, `3pm relative humidity (%)` <int>, `3pm cloud amount (oktas)` <int>, `3pm wind direction` <chr>, `3pm
# wind speed (km/h)` <chr>, `3pm MSL pressure (hPa)` <dbl>