Apache spark 如何按数据集中的几列分组并返回所有列选择?
我想使用Apache spark 如何按数据集中的几列分组并返回所有列选择?,apache-spark,Apache Spark,我想使用groupByAttributes列表对数据集进行分组,我是这样做的: Dataset<Row> groupedRows = initDataset.select(initDataset.col("*")).groupBy(groupByAttributes.toArray(new Column[groupByAttributes .size()])).agg(count("*")); Dataset groupedR
groupByAttributes
列表对数据集进行分组,我是这样做的:
Dataset<Row> groupedRows = initDataset.select(initDataset.col("*")).groupBy(groupByAttributes.toArray(new Column[groupByAttributes .size()])).agg(count("*"));
Dataset groupedRows=initDataset.select(initDataset.col(“*”).groupBy(groupByAttributes.toArray(新列[groupByAttributes.size()]).agg(count(“*”);
如何使用initDataset
的所有列返回groupedRows
附言:加入并没有很大的帮助