Apache spark 尚未分析数据列inputCol,无法在此数据帧上运行TF

Apache spark 尚未分析数据列inputCol,无法在此数据帧上运行TF,apache-spark,tensorflow,pyspark,apache-spark-mllib,Apache Spark,Tensorflow,Pyspark,Apache Spark Mllib,我试图使用通用句子编码器作为spark中文本分析管道的TFT变压器。下面给出了从张量流图创建TFT变压器的代码 将tensorflow导入为tf 将tensorflow_hub导入为hub 来自sparkdl进口变压器 从sparkdl.graph.input导入TFInputGraph 将sparkdl.graph.utils作为tfx导入 从pyspark.sql.types导入行 使用tf.Graph()作为默认值(): 模块=集线器模块(“https://tfhub.dev/google

我试图使用通用句子编码器作为spark中文本分析管道的TFT变压器。下面给出了从张量流图创建TFT变压器的代码

将tensorflow导入为tf
将tensorflow_hub导入为hub
来自sparkdl进口变压器
从sparkdl.graph.input导入TFInputGraph
将sparkdl.graph.utils作为tfx导入
从pyspark.sql.types导入行
使用tf.Graph()作为默认值():
模块=集线器模块(“https://tfhub.dev/google/universal-sentence-encoder-large/3")
text=tf.placeholder(tf.string,[None],name='textinput')
嵌入=模块(文本)
init_op=tf.group([tf.global_variables_initializer(),tf.tables_initializer()]))
使用tf.Session()作为sess:
sess.run(初始化操作)
gin=TFInputGraph.fromGraph(sess.graph,sess,[“文本输入:0'”,“模块应用\默认值/编码器\隐藏\层/l2\规范化:0”])
变压器=变压器(
tfInputGraph=gin,
inputMapping={'inputCol':tfx.tensor_name(“textinput:0”)},
outputMapping={tfx.tensor\u name(“模块应用\u默认值/编码器\u en/隐藏\u层/l2\u规范化:0”):'outputCol'})
行=[行(输入列=[“你好”]),行(输入列=[“你在干什么”])]
sdf=spark.createDataFrame(行)
odf=转换器转换(sdf)
但是,我得到了以下错误

java.lang.Exception:尚未分析数据列inputCol,无法在此数据帧上运行TF
位于org.tensorframes.impl.DebugRowOps$$anonfun$26$$anonfun$27.apply(DebugRowOps.scala:329)
位于org.tensorframes.impl.DebugRowOps$$anonfun$26$$anonfun$27.apply(DebugRowOps.scala:329)
位于scala.Option.getOrElse(Option.scala:121)
位于org.tensorframes.impl.DebugRowOps$$anonfun$26.apply(DebugRowOps.scala:328)
位于org.tensorframes.impl.DebugRowOps$$anonfun$26.apply(DebugRowOps.scala:320)
不确定我的“分析”数据框是什么意思