Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/81.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 创建散点图以显示相关性_R - Fatal编程技术网

R 创建散点图以显示相关性

R 创建散点图以显示相关性,r,R,我试图用我的大数据集创建一个散点图,显示湿度和降雨量之间的相关性。然而,我认为如果我使用一个月内某个特定地点的平均湿度和降雨量之和,相关性会更好,因为现在每天的降雨量数据点为零,因为大多数天都不下雨 问题是,我不确定如何计算一年零一个月内几天的降雨值,同样也不确定如何计算平均湿度。然后通过这样做得到两个相应的数据点(月平均湿度:月降雨量之和)用于散点图 数据集的小示例:最后一列是湿度,第二列是最后一次降雨,第一列是日期 谢谢,非常感谢您提供的任何帮助如果没有数据,我建议您使用dplyr软件包

我试图用我的大数据集创建一个散点图,显示湿度和降雨量之间的相关性。然而,我认为如果我使用一个月内某个特定地点的平均湿度和降雨量之和,相关性会更好,因为现在每天的降雨量数据点为零,因为大多数天都不下雨

问题是,我不确定如何计算一年零一个月内几天的降雨值,同样也不确定如何计算平均湿度。然后通过这样做得到两个相应的数据点(月平均湿度:月降雨量之和)用于散点图

数据集的小示例:最后一列是湿度,第二列是最后一次降雨,第一列是日期


谢谢,非常感谢您提供的任何帮助

如果没有数据,我建议您使用
dplyr
软件包的
groupby()
函数按月分组,然后使用
summary()
计算平均值和总湿度值


编辑:我在澳大利亚政府气象局网站上追踪了过去13个月的降雨量和下午3点的相对湿度数据

我分别使用
data.table
tidyverse
包进行数据摄取和数据清理。以下是我使用的代码:

library(data.table)
library(tidyverse)
df <- as_tibble(fread('IDCJDW2125.csv'))
df <- add_column(df, Month = format(as.Date(df$Date), '%B %Y'), .after = 'Date') %>%
  group_by(Month) %>%
  summarize(sum(`Rainfall (mm)`), mean(`3pm relative humidity (%)`))
colnames(df)[2:3] <- c('Total Rainfall (mm)', 'Average 3 PM Relative Humidity (%)')
ggplot(df, aes(x = `Total Rainfall (mm)`, y = `Average 3 PM Relative Humidity (%)`)) +
  geom_point()
库(data.table)
图书馆(tidyverse)
df%
汇总(总和(`降雨量(mm)`),平均值(`3pm相对湿度(%)`))

colnames(df)[2:3]请不要将代码或数据作为图像发布。使用纯文本,以便其他用户可以复制/粘贴。您可以使用
dput()
和/或
head()
来获取数据,代码可以缩进4个空格。非常感谢您的精彩回复,我正在获取新包,但是我该如何在散点图中添加回归线呢?
# A tibble: 6 x 21
  Date  `Minimum temper~ `Maximum temper~ `Rainfall (mm)` `Evaporation (m~ `Sunshine (hour~ `Direction of m~ `Speed of maxim~ `Time of maximu~ `9am Temperatur~
  <chr>            <dbl>            <dbl>           <dbl>            <dbl>            <dbl> <chr>                       <int> <chr>                       <dbl>
1 2018~              9.2             21.4               0              4                9.6 WSW                            41 15:42                        15.7
2 2018~              9.1             19                 0              5.2              7.9 ENE                            33 14:48                        14.1
3 2018~              9.4             23.4               0              2                9.5 WNW                            57 23:07                        15  
4 2018~             11.3             20.7               0              5.2              8.6 WNW                            54 9:56                         15.5
5 2018~              6.9             20.9               0              5.6             10.3 NE                             41 16:38                        12.6
6 2018~             11.9             19.7               0              4                4   NW                             69 15:16                        13.6
# ... with 11 more variables: `9am relative humidity (%)` <int>, `9am cloud amount (oktas)` <int>, `9am wind direction` <chr>, `9am wind speed (km/h)` <int>, `9am
#   MSL pressure (hPa)` <dbl>, `3pm Temperature (°C)` <dbl>, `3pm relative humidity (%)` <int>, `3pm cloud amount (oktas)` <int>, `3pm wind direction` <chr>, `3pm
#   wind speed (km/h)` <chr>, `3pm MSL pressure (hPa)` <dbl>