Scala 如何从DataFrame获取数组[Seq[String]]?

Scala 如何从DataFrame获取数组[Seq[String]]?,scala,dataframe,Scala,Dataframe,如何将DataFramecc传递到数组[Seq[String]] val factors = $(ccCols).split(",") val cc = dataset.select(factors.head, factors.tail: _*) 我试过这种方法,但它给了我Array[Row]: cc.rdd.collect() 您需要使用行对象的toSeq功能: val a = sc.parallelize(Seq((1,2),(3,4))).toDF("a", "b") a.show /

如何将
DataFrame
cc
传递到
数组[Seq[String]]

val factors = $(ccCols).split(",")
val cc = dataset.select(factors.head, factors.tail: _*)
我试过这种方法,但它给了我
Array[Row]

cc.rdd.collect()

您需要使用
对象的
toSeq
功能:

val a = sc.parallelize(Seq((1,2),(3,4))).toDF("a", "b")
a.show
/*
Output:
+-+-+
|a|b|
+-+-+
|1|2|
|3|4|
+-+-+
*/

a.collect.map(_.toSeq)
// Output: Array(WrappedArray(1, 2), WrappedArray(3, 4))

现在是数组[Seq[Ahy]]。如何用字符串替换任何值?我想一个
a.collect.map(u.toSeq.map(u.toString))
就可以了