Hadoop 如何使用列名从数据帧访问数据
我有一个oracle表,其中存储了xml数据(xmlType)。我正在尝试使用下面的命令将其sqoop到hdfs。xml字段在hdfs文件中显示为nullHadoop 如何使用列名从数据帧访问数据,hadoop,sqoop,Hadoop,Sqoop,我有一个oracle表,其中存储了xml数据(xmlType)。我正在尝试使用下面的命令将其sqoop到hdfs。xml字段在hdfs文件中显示为null sqoop import --connect jdbc:oracle:thin:@DBconnString --username uname --password pwd --delete-target-dir --table sample
sqoop import --connect jdbc:oracle:thin:@DBconnString
--username uname --password pwd
--delete-target-dir
--table sample
--map-column-java column1=String
有人能指出我做错了什么吗?这是sqoop限制,不支持xmlType 这里有一个解决方法,基本上是将xmlType转换为clob,然后使用以下选项将其映射到字符串
--map-column-java "XMLRECORD=String"