Hadoop 如何从本地磁盘上的数据而不是HDFS在配置单元上创建外部表?

Hadoop 如何从本地磁盘上的数据而不是HDFS在配置单元上创建外部表?,hadoop,hive,cloudera,cloudera-cdh,impala,Hadoop,Hive,Cloudera,Cloudera Cdh,Impala,对于HDFS上的数据,我们可以 CREATE EXTERNAL TABLE <table> { id INT, name STRING, age INT } LOCATION 'hdfs_path'; 创建外部表 { id INT, 名称字符串, 年龄智力 }位置“hdfs_路径”; 但是如何为上面的位置指定本地路径呢 谢谢。我认为您无法在本地文件系统上创建外部表。最接近的方法是在AWS S3存储桶上创建一个外部表,位置为“S3://yourbucket/”您可以先使用“HDF

对于HDFS上的数据,我们可以

CREATE EXTERNAL TABLE <table>
{
id INT,
name STRING,
age INT 
} LOCATION 'hdfs_path';
创建外部表
{
id INT,
名称字符串,
年龄智力
}位置“hdfs_路径”;
但是如何为上面的位置指定本地路径呢


谢谢。

我认为您无法在本地文件系统上创建外部表。最接近的方法是在AWS S3存储桶上创建一个外部表,位置为“S3://yourbucket/”

您可以先使用“HDFS dfs-put”将文件上载到HDFS,然后在此基础上创建配置单元外部表

Hive无法在本地文件上创建外部表的原因是,当Hive处理数据时,实际的处理发生在Hadoop集群上,而您的本地文件可能根本无法访问