Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/sql-server/23.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Sql server 如何在Inforomatica中实现循环?其性能如何_Sql Server_Apache Spark_Etl_Informatica - Fatal编程技术网

Sql server 如何在Inforomatica中实现循环?其性能如何

Sql server 如何在Inforomatica中实现循环?其性能如何,sql-server,apache-spark,etl,informatica,Sql Server,Apache Spark,Etl,Informatica,我想知道如何在Informatica 10.4.1中实现游标上的循环,如果使用非常大的数据会非常糟糕,那么性能会如何?因为我需要将SQL过程从SQL server迁移到Informatica,以便在apache spark上运行 我发现有多篇老文章都在讨论如何创建父工作流和子工作流,其中父工作流使用processed_标志通过控制表调用子工作流,但我需要一种更简单的设计和最佳实践,以获得大量行的良好性能。您确定需要一个光标吗?你想写什么查询,而你觉得不能用SELECT语句来表达?使用光标,性能将

我想知道如何在Informatica 10.4.1中实现游标上的循环,如果使用非常大的数据会非常糟糕,那么性能会如何?因为我需要将SQL过程从SQL server迁移到Informatica,以便在apache spark上运行


我发现有多篇老文章都在讨论如何创建父工作流和子工作流,其中父工作流使用processed_标志通过控制表调用子工作流,但我需要一种更简单的设计和最佳实践,以获得大量行的良好性能。

您确定需要一个
光标吗?你想写什么查询,而你觉得不能用
SELECT
语句来表达?使用
光标
,性能将最差,紧跟其后的是
WHILE
。rCTE的性能更高,而非迭代测试的速度最快。有一些奇怪的球的情况下,混合物是最快的;但是这些(就像我说的)都是奇怪的情况。你可以使用Java转换来实现
LOOP
。性能将取决于数据量,您还需要测试新informatica是否具有
循环
转换,但这需要一些研究。在informatica中实现代码应该始终是最后的手段-几乎总是有一个解决方案,可以仅使用可用组件来实现任何问题。编写代码否定了使用ETL工具的许多好处,如果沿着这条路走下去,那么最好开始用代码(Python PL/SQL等)编写所有ETL。如果你开始编写代码,那么它就会成为Informatica的“黑匣子”,你开始失去你的血统/可追溯性能力。为什么不试着专注于>要做什么<而不是>如何做循环<?循环是最糟糕的方式,也许你得到的任何东西都可以改进?