Apache nifi 对于较大的表,Nifi使用ExecuteSQL进行连接
我正在尝试使用NiFi连接多个表。数据源可能是MySQL,或者将来可能是RedShift。目前,我正在为此使用ExecuteSQL处理器,但输出在单个流文件中。因此,对于TB级的数据,这可能不合适。我也尝试过使用generateTableFetch,但它没有连接选项 以下是我的问题:Apache nifi 对于较大的表,Nifi使用ExecuteSQL进行连接,apache-nifi,Apache Nifi,我正在尝试使用NiFi连接多个表。数据源可能是MySQL,或者将来可能是RedShift。目前,我正在为此使用ExecuteSQL处理器,但输出在单个流文件中。因此,对于TB级的数据,这可能不合适。我也尝试过使用generateTableFetch,但它没有连接选项 以下是我的问题: ExecuteSQL处理器有其他选择吗 有没有办法使ExecuteSQL处理器在多个流文件中输出?目前,我可以使用SplitAvro处理器分割ExecuteSQL的输出。但我希望ExecuteSQL本身分割输出 G
- 如果您要连接多个表,那么我们需要使用
处理器ExecuteSQL
- 从NiFi-1.8版本开始,我们可以配置流文件的
,以便ExecuteSQL处理器分割流文件李>最大行数
- 解决这个问题
- 如果源表在
最大值列上有
,则即使数据集越来越大,它也不会索引
减慢过程
- 如果源表上没有创建索引,则始终会进行
全表扫描
,这会减慢处理过程