Sql server 如何在Inforomatica中实现循环?其性能如何
我想知道如何在Informatica 10.4.1中实现游标上的循环,如果使用非常大的数据会非常糟糕,那么性能会如何?因为我需要将SQL过程从SQL server迁移到Informatica,以便在apache spark上运行Sql server 如何在Inforomatica中实现循环?其性能如何,sql-server,apache-spark,etl,informatica,Sql Server,Apache Spark,Etl,Informatica,我想知道如何在Informatica 10.4.1中实现游标上的循环,如果使用非常大的数据会非常糟糕,那么性能会如何?因为我需要将SQL过程从SQL server迁移到Informatica,以便在apache spark上运行 我发现有多篇老文章都在讨论如何创建父工作流和子工作流,其中父工作流使用processed_标志通过控制表调用子工作流,但我需要一种更简单的设计和最佳实践,以获得大量行的良好性能。您确定需要一个光标吗?你想写什么查询,而你觉得不能用SELECT语句来表达?使用光标,性能将
我发现有多篇老文章都在讨论如何创建父工作流和子工作流,其中父工作流使用processed_标志通过控制表调用子工作流,但我需要一种更简单的设计和最佳实践,以获得大量行的良好性能。您确定需要一个
光标吗?你想写什么查询,而你觉得不能用SELECT
语句来表达?使用光标
,性能将最差,紧跟其后的是WHILE
。rCTE的性能更高,而非迭代测试的速度最快。有一些奇怪的球的情况下,混合物是最快的;但是这些(就像我说的)都是奇怪的情况。你可以使用Java转换来实现LOOP
。性能将取决于数据量,您还需要测试新informatica是否具有循环
转换,但这需要一些研究。在informatica中实现代码应该始终是最后的手段-几乎总是有一个解决方案,可以仅使用可用组件来实现任何问题。编写代码否定了使用ETL工具的许多好处,如果沿着这条路走下去,那么最好开始用代码(Python PL/SQL等)编写所有ETL。如果你开始编写代码,那么它就会成为Informatica的“黑匣子”,你开始失去你的血统/可追溯性能力。为什么不试着专注于>要做什么<而不是>如何做循环<?循环是最糟糕的方式,也许你得到的任何东西都可以改进?