在Python中运行配置单元查询?
我在这个问题上已经坚持了几个小时,现在很难取得任何进展。我有一个带有Hue服务器的远程Hadoop实例,我一直在运行配置单元查询。这些很好用。我一直希望通过Python直接运行针对hive的查询,但这就是我的问题所在。我已经试着通过和运行了一些东西。前者给了我:在Python中运行配置单元查询?,python,hadoop,hive,Python,Hadoop,Hive,我在这个问题上已经坚持了几个小时,现在很难取得任何进展。我有一个带有Hue服务器的远程Hadoop实例,我一直在运行配置单元查询。这些很好用。我一直希望通过Python直接运行针对hive的查询,但这就是我的问题所在。我已经试着通过和运行了一些东西。前者给了我: thrift.Thrift.TApplicationException: Invalid method name: 'get_database' 后者刚好超时 我知道服务器使用的是0.10.0-cdh4.3.0,但我不知道如何判断它使
thrift.Thrift.TApplicationException: Invalid method name: 'get_database'
后者刚好超时
我知道服务器使用的是0.10.0-cdh4.3.0,但我不知道如何判断它使用的是HiveServer还是HiveServer2
因此,我的问题有三个方面:
您只需使用ODBC即可。
在植物学中:
import pyodbc
cnxn = pyodbc.connect("DSN=XXX",autocommit=True)
cursor = cnxn.cursor()
cursor.execute("select * from YYY")
其中,XXX
是以前创建的DSN..对于司机来说,去吧
定义DSN的端口时,必须设置端口(默认为10000)以及其HiveServer1还是2。
要知道它是1还是2,您需要访问服务器,并检查哪个进程在相关端口上侦听。(
netstat
将为您提供进程号和端口,jps-m
将为您提供进程号以及它的HiveServer1或2)是否有方法提取从该连接生成的配置单元日志?