Hadoop 如何使用列名从数据帧访问数据

Hadoop 如何使用列名从数据帧访问数据,hadoop,sqoop,Hadoop,Sqoop,我有一个oracle表,其中存储了xml数据(xmlType)。我正在尝试使用下面的命令将其sqoop到hdfs。xml字段在hdfs文件中显示为null sqoop import --connect jdbc:oracle:thin:@DBconnString --username uname --password pwd --delete-target-dir --table sample

我有一个oracle表,其中存储了xml数据(xmlType)。我正在尝试使用下面的命令将其sqoop到hdfs。xml字段在hdfs文件中显示为null

sqoop import --connect jdbc:oracle:thin:@DBconnString 
             --username uname --password pwd 
             --delete-target-dir 
             --table sample 
             --map-column-java column1=String

有人能指出我做错了什么吗?

这是sqoop限制,不支持xmlType

这里有一个解决方法,基本上是将xmlType转换为clob,然后使用以下选项将其映射到字符串

--map-column-java "XMLRECORD=String"