Hive 配置单元-如何存储配置单元查询结果以供以后参考?

Hive 配置单元-如何存储配置单元查询结果以供以后参考?,hive,putty,hiveql,hadoop2,Hive,Putty,Hiveql,Hadoop2,我通常通过putty连接到网关节点,并在那里运行配置单元查询 有时,这些查询会一起运行数小时。至少有几次putty断开连接,查询的执行也会中止 有没有办法以某种方式存储配置单元查询结果,以便我以后可以检查它们 我不想创建另一个表来存储结果。您可以存储结果 INSERT OVERWRITE DIRECTORY 'outputpath' SELECT * FROM table 您可以存储结果 INSERT OVERWRITE DIRECTORY 'outputpath' SELECT * FROM

我通常通过putty连接到网关节点,并在那里运行配置单元查询

有时,这些查询会一起运行数小时。至少有几次putty断开连接,查询的执行也会中止

有没有办法以某种方式存储配置单元查询结果,以便我以后可以检查它们


我不想创建另一个表来存储结果。

您可以存储结果

INSERT OVERWRITE DIRECTORY 'outputpath' SELECT * FROM table

您可以存储结果

INSERT OVERWRITE DIRECTORY 'outputpath' SELECT * FROM table

那么,基本上,您希望在后台运行查询并将结果转储到文本文件中?有像
nohup
batch
这样的实用程序已经存在至少40年了。。。例如,
nohup-hive-e“从wtf中选择计数(*)2>$HOME/query.log 1>$HOME/query.out&
@Samson Scharfrichter:对不起,我犯了一个错误,我更新了问题。putty断开连接时查询中止。你的答案很有用!谢谢。如果您的群集上运行着HiveServer2,如果没有防火墙阻止您的PC连接到端口10000上的HS2计算机,并且如果您不使用Hive CLI变量-->install DBVisualizer或类似的实用程序,您也可以完全避免PuTTY步骤,请安装Hive JDBC驱动程序(最好是Cloudera驱动程序,它是免费下载的;Apache驱动程序需要大量额外的JAR,与较旧的HiveServer2版本相比没有兼容性保证,并且配置Kerberos身份验证是一场噩梦),并直接从您的PC上运行查询。@Samson Scharfrichter:谢谢。我使用了色调,然后配置为使用HS2。出于几个原因,我不太喜欢色调(用户界面比较混乱,旧版本常常在非Ascii字符上崩溃,python代码在服务器端吐出大量笨拙的日志)如果你对色调很满意,好吧。但是如果你想花很多时间在这上面,你可能想试试“真的”数据库工具。因此,基本上,您希望在后台运行查询并将结果转储到文本文件中?有一些实用程序,如
nohup
batch
,已经存在至少40年了……例如
nohup hive-e“从wtf中选择计数(*))2>$HOME/query.log 1>$HOME/query.out&
@Samson Scharfrichter:很抱歉我犯了一个错误,我更新了这个问题。query会在putty断开连接时中止。不过,您的答案很有用!谢谢。如果您的群集上运行HiveServer2,如果没有防火墙阻止您的PC连接到HS2 mac,您也可以完全避免putty步骤在端口10000上安装hine,如果未使用配置单元CLI变量-->安装DBVisualizer或类似实用程序,请安装配置单元JDBC驱动程序(最好是Cloudera驱动程序,它是免费下载的;Apache驱动程序需要大量额外的JAR,与较旧的HiveServer2版本相比没有兼容性保证,并且配置Kerberos身份验证是一场噩梦),并直接从您的PC上运行查询。@Samson Scharfrichter:谢谢。我使用了色调,然后配置为使用HS2。出于几个原因,我不太喜欢色调(用户界面比较混乱,旧版本常常在非Ascii字符上崩溃,python代码在服务器端吐出大量笨拙的日志)。如果您对色调很满意,很好。但是如果您希望在这方面花费大量时间,您可能希望尝试“真正的”数据库工具。如果putty断开连接,查询是否会继续运行?谢谢。如果putty断开连接,查询是否会继续运行?谢谢。