Hive 如何在导入到配置单元之前了解大型csv文件的架构

Hive 如何在导入到配置单元之前了解大型csv文件的架构,hive,Hive,我有一个大的csv文件,这是我的项目的一部分,可在互联网上。此文件需要加载到配置单元中。在不知道文件结构的情况下,如何在配置单元中创建外部表?简单的回答是,您不能。如果您不愿意自己定义模式,可以使用Spark DataFrameReader从文件中派生出来,然后将数据帧保存到配置单元表中,但您可能对结果不满意,这取决于CSV文件中的实际内容。您的文件是否有头,Hadoop安装中是否有色调?你确认结构是静态的还是动态的?如果我在hue/hive中打开文件,那么我就可以知道模式。但是如果不打开,有没

我有一个大的csv文件,这是我的项目的一部分,可在互联网上。此文件需要加载到配置单元中。在不知道文件结构的情况下,如何在配置单元中创建外部表?

简单的回答是,您不能。如果您不愿意自己定义模式,可以使用Spark DataFrameReader从文件中派生出来,然后将数据帧保存到配置单元表中,但您可能对结果不满意,这取决于CSV文件中的实际内容。您的文件是否有头,Hadoop安装中是否有色调?你确认结构是静态的还是动态的?如果我在hue/hive中打开文件,那么我就可以知道模式。但是如果不打开,有没有任何方法,像descripe或select*from xyz limit 1这样的语法?