Join SnappyData与索引共定位联接
我想在SnappyData中的两个表上进行共定位联接,为了进一步加快联接速度,如果我还在两个表的联接列上创建索引,会有帮助吗 更具体地说,这两个表将非常大,如果在大规模上它是成对分区连接,并且在每对分区中,可以使用索引嵌套循环连接而不是简单的嵌套循环连接,这将非常适合我 我找不到这方面的例子或教程,任何解释或指点都将不胜感激 提前谢谢 更新: 这两个表的行数很大,并且表的列数很少(3-4列,均为整数类型): 我想 在Join SnappyData与索引共定位联接,join,indexing,snappydata,Join,Indexing,Snappydata,我想在SnappyData中的两个表上进行共定位联接,为了进一步加快联接速度,如果我还在两个表的联接列上创建索引,会有帮助吗 更具体地说,这两个表将非常大,如果在大规模上它是成对分区连接,并且在每对分区中,可以使用索引嵌套循环连接而不是简单的嵌套循环连接,这将非常适合我 我找不到这方面的例子或教程,任何解释或指点都将不胜感激 提前谢谢 更新: 这两个表的行数很大,并且表的列数很少(3-4列,均为整数类型): 我想 在列B上加入表1和表2,得到如下结果 Table3(Col_A, Col_B, C
列B
上加入表1
和表2
,得到如下结果
Table3(Col_A, Col_B, Col_C),
因此,我更喜欢在连接列Col_B
上对两个连接表进行水平分区(使用行表),而不是使用列表。并使用同位联接来减少数据混乱
即使在分区之后,分区可能仍然太大,因此我想知道是否可以在
Col_B
上独立地在每个分区中创建索引,并将其用于索引联接?在我看来,在SnappyData中,我只能在整个列上创建索引,而不是独立地为每个分区创建索引 你说数据很大。因此,最好使用列表。
您是否尝试过使用partition by/colocateWith
子句创建表
例如:
表1:使用“a1”的列分区创建表T1(a1,a2,…)
表2:使用列分区创建表T2(a1、ax、ay…),列分区由“a1”和“T1”组成
然后,尝试您的查询,并在UI中查看SQL物理计划(连接不应涉及洗牌)。让我们知道进展如何 非常感谢您的回复,我更喜欢行表,请查看更新的问题。
Table3(Col_A, Col_B, Col_C),