Hive 如何从蜂巢外桌的基本路径摄取德鲁伊的兽人?

Hive 如何从蜂巢外桌的基本路径摄取德鲁伊的兽人?,hive,hdfs,olap,druid,orc,Hive,Hdfs,Olap,Druid,Orc,我有一个配置单元外部表指向位置=”hdfs://localhost:8020/sample/path/" 这里/sample/path包含各种分区,如 /sample/path/cola=123/colb=456 /sample/path/cola=324/colb=432 /sample/path/cola=322/colb=234 我曾尝试使用index_parallel将数据摄取到apache druid中,但在这样做的同时,我必须提到叶子级别的完整分区目录: "paths&q

我有一个配置单元外部表指向位置=”hdfs://localhost:8020/sample/path/" 这里/sample/path包含各种分区,如

/sample/path/cola=123/colb=456
/sample/path/cola=324/colb=432
/sample/path/cola=322/colb=234
我曾尝试使用index_parallel将数据摄取到apache druid中,但在这样做的同时,我必须提到叶子级别的完整分区目录:

"paths":"/sample/path/cola=123/colb=456,/sample/path/cola=324/colb=432,/sample/path/cola=322/colb=234"
一旦这些分区列被摄取到druid中,它们的值就会丢失


问题:是否有某种方法可以指定基本路径并在数据摄取后保留分区列的值?恐怕不行。您正在接收这些文件,它们只是不包含分区列的值。要接收这些数据,表中的列必须有两次,一次作为分区列,另一次作为常规列