Apache spark 为什么DataFrame Row.getAs[Vector]失败？_Apache Spark_Dataframe_Spark Dataframe

Apache spark 为什么DataFrame Row.getAs[Vector]失败？

apache-spark dataframe

Apache spark 为什么DataFrame Row.getAs[Vector]失败？,apache-spark,dataframe,spark-dataframe,Apache Spark,Dataframe,Spark Dataframe,我有一个Spark DataFrame，它有两列类型，分别是String和org.apache.Spark.ml.linalg.SparseVector，这很好用： data.map(r => r(1).asInstanceOf[Vector]) 但是赫塔斯 data.map(r => r.getAs[Vector](1)) 失败于错误：找不到数据集中存储的类型的编码器。原始的类型（Int、String等）和产品类型（case类）是通过导入spark.implicits支持

我有一个Spark DataFrame，它有两列类型，分别是String和org.apache.Spark.ml.linalg.SparseVector，这很好用：

data.map(r => r(1).asInstanceOf[Vector])

但是赫塔斯

data.map(r => r.getAs[Vector](1))

失败于

错误：找不到数据集中存储的类型的编码器。原始的类型（Int、String等）和产品类型（case类）是通过导入spark.implicits支持。\u支持序列化其他类型将在将来的版本中添加

请解释一下原因好吗？

试试这个：

data.rdd.map（r=>r.getAs[Vector]（1））

有关

编码器

和

数据集

的更多信息，请阅读