Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/81.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
在R中提取唯一列组合并求和和和计数_R_Group By_Summarize - Fatal编程技术网

在R中提取唯一列组合并求和和和计数

在R中提取唯一列组合并求和和和计数,r,group-by,summarize,R,Group By,Summarize,我有一个航班数据库,有4列,如下所示 原件: 我想要一个输出,它根据3列(始发地/目的地/航空公司)的唯一组合给出行,对每个唯一组合的乘客数求和,并计算每个唯一组合的行数。结果会是这样的 输出: 我可以使用groupby功能完成其中的一部分 df %>% group_by(Origin, destination, carrier) %>% summarise(count = n()) 如何包含人口总数?我们可以使用dplyr library(dplyr) df1 %>%

我有一个航班数据库,有4列,如下所示

原件:

我想要一个输出,它根据3列(始发地/目的地/航空公司)的唯一组合给出行,对每个唯一组合的乘客数求和,并计算每个唯一组合的行数。结果会是这样的

输出:

我可以使用
groupby
功能完成其中的一部分

df %>% group_by(Origin, destination, carrier) %>% summarise(count = n())

如何包含人口总数?

我们可以使用
dplyr

library(dplyr)
df1 %>%
   group_by(Origin, Destination, Airline) %>%
   dplyr::summarise(count = n(), TotalPassengers = sum(Passengers))
# Groups:   Origin, Destination [2]
#  Origin Destination Airline count TotalPassengers
#  <chr>  <chr>       <chr>   <int>           <dbl>
#1 ABE    ATL         9A          2               3
#2 ABE    ATL         DL          1               5
#3 NYC    SFA         AA          3              21
#4 NYC    SFA         DL          1               5
库(dplyr)
df1%>%
组别(始发地、目的地、航空公司)%>%
dplyr::总结(count=n(),TotalPassengers=sum(Passengers))
#分组:起点、终点[2]
#始发地目的地航空公司旅客总数
#                         
#1 ABE ATL 9A 2 3
#2 ABE ATL DL 1 5
#3纽约市SFA AA 3 21
#4纽约市SFA DL 1 5
数据
df1我们可以使用
dplyr

library(dplyr)
df1 %>%
   group_by(Origin, Destination, Airline) %>%
   dplyr::summarise(count = n(), TotalPassengers = sum(Passengers))
# Groups:   Origin, Destination [2]
#  Origin Destination Airline count TotalPassengers
#  <chr>  <chr>       <chr>   <int>           <dbl>
#1 ABE    ATL         9A          2               3
#2 ABE    ATL         DL          1               5
#3 NYC    SFA         AA          3              21
#4 NYC    SFA         DL          1               5
库(dplyr)
df1%>%
组别(始发地、目的地、航空公司)%>%
dplyr::总结(count=n(),TotalPassengers=sum(Passengers))
#分组:起点、终点[2]
#始发地目的地航空公司旅客总数
#                         
#1 ABE ATL 9A 2 3
#2 ABE ATL DL 1 5
#3纽约市SFA AA 3 21
#4纽约市SFA DL 1 5
数据
df1@GreenFinance好吧,我得到了你期望的结果output@GreenFinance如果您加载了
plyr
plyr::summary
可能会屏蔽
dplyr::summary
do
df1%>%groupby(始发地、目的地、航空公司)%%>%dplyr::summary(count=n(),TotalPassengers=sum(Passengers))
,现在就去拿。我犯了个错误。谢谢again@GreenFinance没关系。我只是说,因为很多新到这个网站的人都不愿意给回答这个问题的人打分。话虽如此,这些观点毫无意义,它没有收入结构,也没有youtube等网站的收入结构。它只是一种增值的象征。@GreenFinance好吧,我得到了你预期的结果output@GreenFinance如果已加载
plyr
plyr::summary
可以屏蔽
dplyr::summary
do
df1%>%groupby(始发地、目的地、航空公司)%%>%dplyr::summary(count=n(),TotalPassengers=sum(Passengers))
是的,现在就得到它。我犯了个错误。谢谢again@GreenFinance没关系。我只是说,因为很多新到这个网站的人都不愿意给回答这个问题的人打分。话虽如此,这些观点毫无意义,它没有收入结构,也没有youtube等网站的收入结构。它只是一种增值的象征。