Apache spark 如何显示“org.apache.spark.sql.Dataset”？_Apache Spark

Apache spark 如何显示“org.apache.spark.sql.Dataset”？

apache-spark

Apache spark 如何显示“org.apache.spark.sql.Dataset”？,apache-spark,Apache Spark,我有这个数据集，我想打印出这些值我试图对对象进行计数，结果得到res96:org.apache.spark.sql.Dataset[Boolean，Long]=[value:Boolean，count1:bigint] 这是从这个代码 mydf .count 我试着做一个节目，但我犯了这个错误 <console>:83: error: value show is not a member of org.apache.spark.sql.KeyValueGroupedDat

我有这个数据集，我想打印出这些值

我试图对对象进行计数，结果得到res96:org.apache.spark.sql.Dataset[Boolean，Long]=[value:Boolean，count1:bigint]

这是从这个代码

mydf
    .count

我试着做一个节目，但我犯了这个错误

<console>:83: error: value show is not a member of org.apache.spark.sql.KeyValueGroupedDataset[Boolean,com.asana.data.services.parquetlogs.ParsedLog]
possible cause: maybe a semicolon is missing before `value show'?
           .show
            ^

您以前可能已经对数据帧进行了分组，所以目前它没有show方法，您必须首先对其应用一些聚合函数

要获取当前数据，可以尝试向其添加一些映射，例如：mydf.mapGroups{casek，iter=>k，iter.mapx=>x.\u 2.toArray}。然后你就可以根据结果调用show。

你能发布完整的代码吗？是的，我发布了完整的代码，你也能发布输入和预期的输出样本数据吗？太好了，我发布了完整的代码。我将尝试mydf.mapGroups{casek，iter=>k，iter.mapx=>x._2.toArray}。showIt返回了这个错误：84:error:value{u 2不是com的成员。[myinstance].data.services.parquetlogs.parsedlog您可以尝试将其更改为mydf.mapGroups{casek，iter=>k，iter.toArray}基本上，您需要任何东西才能从分组一中获取常用的数据帧。

val groupedDF = mydf.groupByKey(mydf => {
    val group = mydf.value
    group
    })