Performance 临时表与物理表上的数据流任务
下面是一个场景 我有一个用于csv文件的暂存表,它是我的源文件。我正在将它加载到物理暂存表中。我将在包的后面部分对此暂存表数据进行转换。我需要新的数据(因为它来自源文件) 我应该在临时表中进行转换,还是应该再次使用dataflow任务重新加载临时表Performance 临时表与物理表上的数据流任务,performance,ssis,dataflowtask,temp-tables,Performance,Ssis,Dataflowtask,Temp Tables,下面是一个场景 我有一个用于csv文件的暂存表,它是我的源文件。我正在将它加载到物理暂存表中。我将在包的后面部分对此暂存表数据进行转换。我需要新的数据(因为它来自源文件) 我应该在临时表中进行转换,还是应该再次使用dataflow任务重新加载临时表 数据不是更多[微笑]只是不到一百万而已这有一个标准模式 提取数据(从CSV到临时区域) 转换数据(清理数据、转换数据、格式化数据、将其他内容加入数据、使其与新系统兼容) 加载数据(更新/插入/删除活动表) 这就是ETL的首字母缩略词的来源- 您拥有的
数据不是更多[微笑]只是不到一百万而已这有一个标准模式
仅供参考-如果您使用的是SQL Server,请查看SSI。thnks我在包中使用的是临时表,因为我的包中还有许多其他内容(完整的业务流程,而不仅仅是ETL)。所以,如果我能找到更好的选择,我认为最好避免由于临时表而消耗服务器空间(RAM)。所以问题来了。正如你所说,可维护性确实会变得更好