Join SnappyData与索引共定位联接_Join_Indexing_Snappydata

Join SnappyData与索引共定位联接

join indexing

Join SnappyData与索引共定位联接,join,indexing,snappydata,Join,Indexing,Snappydata,我想在SnappyData中的两个表上进行共定位联接，为了进一步加快联接速度，如果我还在两个表的联接列上创建索引，会有帮助吗更具体地说，这两个表将非常大，如果在大规模上它是成对分区连接，并且在每对分区中，可以使用索引嵌套循环连接而不是简单的嵌套循环连接，这将非常适合我我找不到这方面的例子或教程，任何解释或指点都将不胜感激提前谢谢更新：这两个表的行数很大，并且表的列数很少（3-4列，均为整数类型）：我想在列B上加入表1和表2，得到如下结果 Table3(Col_A, Col_B, C

我想在SnappyData中的两个表上进行共定位联接，为了进一步加快联接速度，如果我还在两个表的联接列上创建索引，会有帮助吗

更具体地说，这两个表将非常大，如果在大规模上它是成对分区连接，并且在每对分区中，可以使用索引嵌套循环连接而不是简单的嵌套循环连接，这将非常适合我

我找不到这方面的例子或教程，任何解释或指点都将不胜感激

提前谢谢

更新：

这两个表的行数很大，并且表的列数很少（3-4列，均为整数类型）：

我想在

列B

上加入

表1

和

表2

，得到如下结果

Table3(Col_A, Col_B, Col_C),

因此，我更喜欢在连接列

Col_B

上对两个连接表进行水平分区（使用行表），而不是使用列表。并使用同位联接来减少数据混乱

即使在分区之后，分区可能仍然太大，因此我想知道是否可以在

Col_B

上独立地在每个分区中创建索引，并将其用于索引联接？在我看来，在SnappyData中，我只能在整个列上创建索引，而不是独立地为每个分区创建索引

你说数据很大。因此，最好使用列表。您是否尝试过使用

partition by/colocateWith

子句创建表

例如：表1:

使用“a1”的列分区创建表T1（a1，a2，…）

表2:

使用列分区创建表T2（a1、ax、ay…），列分区由“a1”和“T1”组成
然后，尝试您的查询，并在UI中查看SQL物理计划（连接不应涉及洗牌）。让我们知道进展如何 非常感谢您的回复，我更喜欢行表，请查看更新的问题。
Table3(Col_A, Col_B, Col_C),