Hive 配置单元外部表位置与加载路径

Hive 配置单元外部表位置与加载路径,hive,external,Hive,External,通过浏览有关外部表和托管表的internet,我了解到在创建外部表时需要指定位置,因为配置单元将在给定位置创建表,但对于托管表,将使用hive.metastore.warehouse.dir中提到的默认目录。 如果有什么误会,请纠正我 让我困惑的是: LOCATION子句用于指定外部表的数据存在的位置,还是用于创建存储实际数据的目录 如果LOCATION子句用于指定数据存在的位置,那么为什么在LOAD语句中使用PATH子句呢 外部表的DDL中的location子句用于 指定需要存储数据的hdfs

通过浏览有关外部表和托管表的internet,我了解到在创建外部表时需要指定位置,因为配置单元将在给定位置创建表,但对于托管表,将使用hive.metastore.warehouse.dir中提到的默认目录。 如果有什么误会,请纠正我

让我困惑的是:

  • LOCATION子句用于指定外部表的数据存在的位置,还是用于创建存储实际数据的目录
  • 如果LOCATION子句用于指定数据存在的位置,那么为什么在LOAD语句中使用PATH子句呢
  • 外部表的DDL中的location子句用于 指定需要存储数据的hdfs位置。后来 在查询表时,将从指定的 路径

  • load data inpath是源文件的路径,从中加载数据 已加载到表中。源可以是本地文件 路径或hdfs文件路径

  • 希望我已经消除了你的困惑