如何告知talend在加入时不保存数据

如何告知talend在加入时不保存数据,talend,Talend,我问的是如何在talend中做一些事情,这是datastage中的一个特性 我看到一个talend作业,如果我要执行连接或查找,talend会尝试“记忆”连接前的整个查找或引用数据集。我的数据集太大了,talend无法“记忆”,因此无法完成任务 在datastage中,我可以通过在联接阶段前面设置排序阶段来避免这种情况,联接阶段通过使用“排序联接”来独占这种情况,而整个数据集不保存在内存中,而是在联接进行时立即联接并发送到下一个阶段,从而节省了内存 我如何在talend中实现这一点? 谢谢。我想

我问的是如何在talend中做一些事情,这是datastage中的一个特性

我看到一个talend作业,如果我要执行连接或查找,talend会尝试“记忆”连接前的整个查找或引用数据集。我的数据集太大了,talend无法“记忆”,因此无法完成任务

在datastage中,我可以通过在联接阶段前面设置排序阶段来避免这种情况,联接阶段通过使用“排序联接”来独占这种情况,而整个数据集不保存在内存中,而是在联接进行时立即联接并发送到下一个阶段,从而节省了内存

我如何在talend中实现这一点? 谢谢。

我想你可以

  • 使用将存储在磁盘上的“tmap”的临时文件存储选项
  • 放大“tmap”中的缓冲区大小
  • 或者组件“tmemorize”
我想你可以

  • 使用将存储在磁盘上的“tmap”的临时文件存储选项
  • 放大“tmap”中的缓冲区大小
  • 或者组件“tmemorize”

当您从数据库中检索1.8亿条记录时,它可能会影响ETL性能,因此您可以在数据库服务器中执行这种连接。

当您从数据库中检索1.8亿条记录时,它可能会影响ETL性能,因此当您有一个具有180Mil的表时,您也可以在数据库服务器中执行这种连接。

记录,这就是你放在缓冲区里的吗?当你有一个有180Mil条记录的表时,你不会把数据拉到Talend。你把“较小”的数据放在它旁边,让数据库进行连接。当你有一个有180Mil条记录的表时,这就是你放在缓冲区中的数据吗?当你有一个有180Mil条记录的表时,你不会把数据拉到Talend。您将“较小”的数据放在它旁边,并让数据库进行连接。