在R中提取唯一列组合并求和和和计数_R_Group By_Summarize

在R中提取唯一列组合并求和和和计数

在R中提取唯一列组合并求和和和计数,r,group-by,summarize,R,Group By,Summarize,我有一个航班数据库，有4列，如下所示原件：我想要一个输出，它根据3列（始发地/目的地/航空公司）的唯一组合给出行，对每个唯一组合的乘客数求和，并计算每个唯一组合的行数。结果会是这样的输出：我可以使用groupby功能完成其中的一部分 df %>% group_by(Origin, destination, carrier) %>% summarise(count = n()) 如何包含人口总数？我们可以使用dplyr library(dplyr) df1 %>%

我有一个航班数据库，有4列，如下所示

原件：

我想要一个输出，它根据3列（始发地/目的地/航空公司）的唯一组合给出行，对每个唯一组合的乘客数求和，并计算每个唯一组合的行数。结果会是这样的

输出：

我可以使用

groupby

功能完成其中的一部分

df %>% group_by(Origin, destination, carrier) %>% summarise(count = n())

如何包含人口总数？

我们可以使用

dplyr

library(dplyr)
df1 %>%
   group_by(Origin, Destination, Airline) %>%
   dplyr::summarise(count = n(), TotalPassengers = sum(Passengers))
# Groups:   Origin, Destination [2]
#  Origin Destination Airline count TotalPassengers
#  <chr>  <chr>       <chr>   <int>           <dbl>
#1 ABE    ATL         9A          2               3
#2 ABE    ATL         DL          1               5
#3 NYC    SFA         AA          3              21
#4 NYC    SFA         DL          1               5

库（dplyr）
df1%>%
组别（始发地、目的地、航空公司）%>%
dplyr：：总结（count=n（），TotalPassengers=sum（Passengers））
#分组：起点、终点[2]
#始发地目的地航空公司旅客总数
#                         
#1 ABE ATL 9A 2 3
#2 ABE ATL DL 1 5
#3纽约市SFA AA 3 21
#4纽约市SFA DL 1 5

数据

df1我们可以使用dplyr

library(dplyr)
df1 %>%
   group_by(Origin, Destination, Airline) %>%
   dplyr::summarise(count = n(), TotalPassengers = sum(Passengers))
# Groups:   Origin, Destination [2]
#  Origin Destination Airline count TotalPassengers
#  <chr>  <chr>       <chr>   <int>           <dbl>
#1 ABE    ATL         9A          2               3
#2 ABE    ATL         DL          1               5
#3 NYC    SFA         AA          3              21
#4 NYC    SFA         DL          1               5

库（dplyr）
df1%>%
组别（始发地、目的地、航空公司）%>%
dplyr：：总结（count=n（），TotalPassengers=sum（Passengers））
#分组：起点、终点[2]
#始发地目的地航空公司旅客总数
#                         
#1 ABE ATL 9A 2 3
#2 ABE ATL DL 1 5
#3纽约市SFA AA 3 21
#4纽约市SFA DL 1 5

数据
df1@GreenFinance好吧，我得到了你期望的结果output@GreenFinance如果您加载了plyr
，plyr:：summary
可能会屏蔽dplyr:：summary
dodf1%>%groupby（始发地、目的地、航空公司）%%>%dplyr:：summary（count=n（），TotalPassengers=sum（Passengers））
，现在就去拿。我犯了个错误。谢谢again@GreenFinance没关系。我只是说，因为很多新到这个网站的人都不愿意给回答这个问题的人打分。话虽如此，这些观点毫无意义，它没有收入结构，也没有youtube等网站的收入结构。它只是一种增值的象征。@GreenFinance好吧，我得到了你预期的结果output@GreenFinance如果已加载plyr
，plyr:：summary
可以屏蔽dplyr:：summary
dodf1%>%groupby（始发地、目的地、航空公司）%%>%dplyr:：summary（count=n（），TotalPassengers=sum（Passengers））
是的，现在就得到它。我犯了个错误。谢谢again@GreenFinance没关系。我只是说，因为很多新到这个网站的人都不愿意给回答这个问题的人打分。话虽如此，这些观点毫无意义，它没有收入结构，也没有youtube等网站的收入结构。它只是一种增值的象征。