Scala Spark获得一列作为齐柏林飞艇选择表单中使用的序列

Scala Spark获得一列作为齐柏林飞艇选择表单中使用的序列,scala,apache-spark,apache-spark-sql,rdd,apache-zeppelin,Scala,Apache Spark,Apache Spark Sql,Rdd,Apache Zeppelin,我有一个数据框,我想从中选择列作为seq,以便在齐柏林飞艇选择表单中使用 以下是选择表单的工作方式: 选择表格要求 required: Iterable[(Object, String)] 我得到的是 val test_seq = data.select("file", "id").collect().map(x => (x.get(0), x.get(1).toString)).toSeq 这是形式上的 found: Seq[(Any, St

我有一个数据框,我想从中选择列作为seq,以便在齐柏林飞艇选择表单中使用

以下是选择表单的工作方式:

选择表格要求

required: Iterable[(Object, String)]
我得到的是

val test_seq = data.select("file", "id").collect().map(x => (x.get(0), x.get(1).toString)).toSeq
这是形式上的

found: Seq[(Any, String)]

并且在表单中不可用。我还没有弄清楚如何以正确的格式从数据帧中提取列。

您可以尝试从RDD中获取对象和字符串的元组,并使用
toIterable
转换为
Iterable[(对象,字符串)]


很好,谢谢。对于将来搜索此页面的用户,不要尝试使用巨大的数据帧,因为这会使页面无响应:)
val testIter = data.select("file", "id").collect().map(
    x => (x.getAs[Object](0), x.getAs[String](1))
).toIterable