如何告知talend在加入时不保存数据_Talend

如何告知talend在加入时不保存数据

talend

如何告知talend在加入时不保存数据,talend,Talend,我问的是如何在talend中做一些事情，这是datastage中的一个特性我看到一个talend作业，如果我要执行连接或查找，talend会尝试“记忆”连接前的整个查找或引用数据集。我的数据集太大了，talend无法“记忆”，因此无法完成任务在datastage中，我可以通过在联接阶段前面设置排序阶段来避免这种情况，联接阶段通过使用“排序联接”来独占这种情况，而整个数据集不保存在内存中，而是在联接进行时立即联接并发送到下一个阶段，从而节省了内存我如何在talend中实现这一点？谢谢。我想

我问的是如何在talend中做一些事情，这是datastage中的一个特性

我看到一个talend作业，如果我要执行连接或查找，talend会尝试“记忆”连接前的整个查找或引用数据集。我的数据集太大了，talend无法“记忆”，因此无法完成任务

在datastage中，我可以通过在联接阶段前面设置排序阶段来避免这种情况，联接阶段通过使用“排序联接”来独占这种情况，而整个数据集不保存在内存中，而是在联接进行时立即联接并发送到下一个阶段，从而节省了内存

我如何在talend中实现这一点？谢谢。

我想你可以

使用将存储在磁盘上的“tmap”的临时文件存储选项
放大“tmap”中的缓冲区大小
或者组件“tmemorize”

我想你可以

使用将存储在磁盘上的“tmap”的临时文件存储选项
放大“tmap”中的缓冲区大小
或者组件“tmemorize”

当您从数据库中检索1.8亿条记录时，它可能会影响ETL性能，因此您可以在数据库服务器中执行这种连接。

当您从数据库中检索1.8亿条记录时，它可能会影响ETL性能，因此当您有一个具有180Mil的表时，您也可以在数据库服务器中执行这种连接。

记录，这就是你放在缓冲区里的吗？当你有一个有180Mil条记录的表时，你不会把数据拉到Talend。你把“较小”的数据放在它旁边，让数据库进行连接。当你有一个有180Mil条记录的表时，这就是你放在缓冲区中的数据吗？当你有一个有180Mil条记录的表时，你不会把数据拉到Talend。您将“较小”的数据放在它旁边，并让数据库进行连接。