Hive 使用配置单元连接到远程服务器

Hive 使用配置单元连接到远程服务器,hive,Hive,所以我有两台机器,我正试图用另一台机器连接到配置单元服务器。我只要进去就行了 $hive-h-p 但是,它说我需要安装hadoop。我只想远程连接。那么为什么我需要hadoop呢?有没有办法绕过这个问题?hive程序依赖于hadoop程序,因为它通过读取HDF、启动map reduce作业等方式工作。(在配置单元中,与典型的数据库服务器不同,命令行界面实际上执行所有查询处理,将其转换为底层实现;因此,通常不会以您期望的方式运行“配置单元服务器”。)这并不意味着您需要在这台机器上实际安装Hadoo

所以我有两台机器,我正试图用另一台机器连接到配置单元服务器。我只要进去就行了

$hive-h-p


但是,它说我需要安装hadoop。我只想远程连接。那么为什么我需要hadoop呢?有没有办法绕过这个问题?

hive程序依赖于
hadoop
程序,因为它通过读取HDF、启动map reduce作业等方式工作。(在配置单元中,与典型的数据库服务器不同,命令行界面实际上执行所有查询处理,将其转换为底层实现;因此,通常不会以您期望的方式运行“配置单元服务器”。)这并不意味着您需要在这台机器上实际安装Hadoop群集,但您需要安装基本软件才能连接到Hadoop群集

绕过此问题的一种方法是在具有Hadoop基础设施的机箱上运行Hive JDBC/Thrift server,即运行带有命令行选项的
Hive
程序,将其作为Hive服务器在所需端口上运行,依此类推,然后使用您最喜欢的支持JDBC的SQL客户端连接到它这是一种典型DBMS的数据库服务器模型(尽管它仍然不同,因为它仍然保留了不通过此服务器的其他
hive
连接的可能性)。(注意:以前设置起来有点棘手。我不确定现在是否比以前容易。)


这可能是显而易见的,但为了完整性:另一种绕过此限制的方法是使用
ssh
,并在具有Hadoop基础设施的机箱上实际运行
hive
:-

较新的hive CLI实际上允许连接到远程Thrift服务器。请参阅远程计算机应运行配置单元服务器的开头部分,以使其正常工作

您不需要将本地框作为Hadoop集群的一部分。但是,您可能需要Hadoop程序/JAR才能使Hive正常工作。如果您从标准存储库安装配置单元,它应该包括Hadoop发行版