`dpylr `字段中唯一项目的计数函数

`dpylr `字段中唯一项目的计数函数,r,R,我已经在这里搜索过几次了,如果这是重复的,我深表歉意 我是第一次和dplyr合作,我很难想出我想要的。如果我正在执行SQL,查询将如下所示: select count(customer_id), sum(sales), (sum(sales) / count(customer_id), * from data_table group by salesperson_id 总之,我想: 按销售人员分组数据 把总销售额加起来 计算唯一客户的数量 查找每个销售人员每个客户的平均销售额 此时我不想

我已经在这里搜索过几次了,如果这是重复的,我深表歉意

我是第一次和dplyr合作,我很难想出我想要的。如果我正在执行SQL,查询将如下所示:

select count(customer_id), sum(sales), (sum(sales) / count(customer_id), *
  from data_table
 group by salesperson_id
总之,我想:

  • 按销售人员分组数据
  • 把总销售额加起来
  • 计算唯一客户的数量
  • 查找每个销售人员每个客户的平均销售额
  • 此时我不想去掉“不相关”字段,因为它们将在以后的步骤中变得相关


    我被卡住了,特别是因为
    dplyr
    提供的唯一计数函数不接受任何参数我应该使用什么聚合函数来计算字段中的不同项数?

    回答以下问题:我应该使用什么聚合函数来计算字段中的不同项数?

    n_distinct()

    见文件

    一个更广泛的例子,尽管原始问题中的A有助于:

    data_table %>%
        group_by(salesperson_id) %>%
        mutate(
            customers = n_distinct(customer_id),
            sales = sum(sales),
            sales_per_customer = sales / customers
        )
    

    您能否编辑您的问题以包含一些示例数据?例如,使用
    dput(head(df))
    (其中
    df
    是您正在使用的数据帧的名称)?