Apache spark 如何显示“org.apache.spark.sql.Dataset”?

Apache spark 如何显示“org.apache.spark.sql.Dataset”?,apache-spark,Apache Spark,我有这个数据集,我想打印出这些值 我试图对对象进行计数,结果得到res96:org.apache.spark.sql.Dataset[Boolean,Long]=[value:Boolean,count1:bigint] 这是从这个代码 mydf .count 我试着做一个节目,但我犯了这个错误 <console>:83: error: value show is not a member of org.apache.spark.sql.KeyValueGroupedDat

我有这个数据集,我想打印出这些值

我试图对对象进行计数,结果得到res96:org.apache.spark.sql.Dataset[Boolean,Long]=[value:Boolean,count1:bigint]

这是从这个代码

mydf
    .count
我试着做一个节目,但我犯了这个错误

<console>:83: error: value show is not a member of org.apache.spark.sql.KeyValueGroupedDataset[Boolean,com.asana.data.services.parquetlogs.ParsedLog]
possible cause: maybe a semicolon is missing before `value show'?
           .show
            ^

您以前可能已经对数据帧进行了分组,所以目前它没有show方法,您必须首先对其应用一些聚合函数


要获取当前数据,可以尝试向其添加一些映射,例如:mydf.mapGroups{casek,iter=>k,iter.mapx=>x.\u 2.toArray}。然后你就可以根据结果调用show。

你能发布完整的代码吗?是的,我发布了完整的代码,你也能发布输入和预期的输出样本数据吗?太好了,我发布了完整的代码。我将尝试mydf.mapGroups{casek,iter=>k,iter.mapx=>x._2.toArray}。showIt返回了这个错误:84:error:value{u 2不是com的成员。[myinstance].data.services.parquetlogs.parsedlog您可以尝试将其更改为mydf.mapGroups{casek,iter=>k,iter.toArray}基本上,您需要任何东西才能从分组一中获取常用的数据帧。
val groupedDF = mydf.groupByKey(mydf => {
    val group = mydf.value
    group
    })