Sql server 如何在Inforomatica中实现循环？其性能如何_Sql Server_Apache Spark_Etl_Informatica

Sql server 如何在Inforomatica中实现循环？其性能如何

sql-server apache-spark

Sql server 如何在Inforomatica中实现循环？其性能如何,sql-server,apache-spark,etl,informatica,Sql Server,Apache Spark,Etl,Informatica,我想知道如何在Informatica 10.4.1中实现游标上的循环，如果使用非常大的数据会非常糟糕，那么性能会如何？因为我需要将SQL过程从SQL server迁移到Informatica，以便在apache spark上运行我发现有多篇老文章都在讨论如何创建父工作流和子工作流，其中父工作流使用processed_标志通过控制表调用子工作流，但我需要一种更简单的设计和最佳实践，以获得大量行的良好性能。您确定需要一个光标吗？你想写什么查询，而你觉得不能用SELECT语句来表达？使用光标，性能将

我想知道如何在Informatica 10.4.1中实现游标上的循环，如果使用非常大的数据会非常糟糕，那么性能会如何？因为我需要将SQL过程从SQL server迁移到Informatica，以便在apache spark上运行

我发现有多篇老文章都在讨论如何创建父工作流和子工作流，其中父工作流使用processed_标志通过控制表调用子工作流，但我需要一种更简单的设计和最佳实践，以获得大量行的良好性能。

您确定需要一个

光标吗？你想写什么查询，而你觉得不能用SELECT
语句来表达？使用光标
，性能将最差，紧跟其后的是WHILE
。rCTE的性能更高，而非迭代测试的速度最快。有一些奇怪的球的情况下，混合物是最快的；但是这些（就像我说的）都是奇怪的情况。你可以使用Java转换来实现LOOP
。性能将取决于数据量，您还需要测试新informatica是否具有循环
转换，但这需要一些研究。在informatica中实现代码应该始终是最后的手段-几乎总是有一个解决方案，可以仅使用可用组件来实现任何问题。编写代码否定了使用ETL工具的许多好处，如果沿着这条路走下去，那么最好开始用代码（Python PL/SQL等）编写所有ETL。如果你开始编写代码，那么它就会成为Informatica的“黑匣子”，你开始失去你的血统/可追溯性能力。为什么不试着专注于>要做什么<而不是>如何做循环<？循环是最糟糕的方式，也许你得到的任何东西都可以改进？