映射到HBase的配置单元表上的联接

映射到HBase的配置单元表上的联接,hbase,hive,Hbase,Hive,我们在HBase中创建了表,这些表使用HBase存储处理程序映射到配置单元。如果这些表有巨大的记录,比如说1亿条记录,如果我们需要基于某个列连接这两个表,并且如果这些列不是行键id列,那么性能会如何,我们有没有办法提高映射到HBase的配置单元表的表连接的性能 问候,, GHK.您使用哪种底层存储来实现配置单元连接性能并不重要。所以HBase rowkey不能帮助您解决Hive问题 您可以使用的一个技巧是mapjoin,如果您将小表与大表连接起来,它会非常有效 您可以在这个链接上阅读更多关于配置

我们在HBase中创建了表,这些表使用HBase存储处理程序映射到配置单元。如果这些表有巨大的记录,比如说1亿条记录,如果我们需要基于某个列连接这两个表,并且如果这些列不是行键id列,那么性能会如何,我们有没有办法提高映射到HBase的配置单元表的表连接的性能

问候,,
GHK.

您使用哪种底层存储来实现配置单元连接性能并不重要。所以HBase rowkey不能帮助您解决Hive问题

您可以使用的一个技巧是mapjoin,如果您将小表与大表连接起来,它会非常有效


您可以在这个链接上阅读更多关于配置单元连接性能的信息

我知道了,但是在配置单元中,我们有一些分区可以帮助我们限制连接操作的记录数,如果我们有一个配置单元映射HBase表,那么有没有一种方法可以在表JOIN中实现更快的响应我认为这在HBase存储处理程序中是不可能的。看看这个关于那个的吉拉