Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/laravel/11.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Hadoop Sqoop vs Informatica大数据版用于数据源_Hadoop_Hive_Sqoop_Informatica Powercenter - Fatal编程技术网

Hadoop Sqoop vs Informatica大数据版用于数据源

Hadoop Sqoop vs Informatica大数据版用于数据源,hadoop,hive,sqoop,informatica-powercenter,Hadoop,Hive,Sqoop,Informatica Powercenter,我可以选择使用Sqoop或Informatica Big Data edition将数据源化到HDFS中。源系统是Oracle的Tearadata 我想知道哪一个更好,以及背后的原因 注: 我当前的实用程序能够使用sqoop将数据拉入HDFS,创建配置单元暂存表和归档外部表 Informatica是组织中使用的ETL工具 问候 桑吉布 Sqoop能够从Oracle/Teradata执行完全和增量加载 Sqoop从源系统并行复制数据 Sqoop脚本可以由Oozie自定义生成和调度 任何规模集群的

我可以选择使用Sqoop或Informatica Big Data edition将数据源化到HDFS中。源系统是Oracle的Tearadata

我想知道哪一个更好,以及背后的原因

注: 我当前的实用程序能够使用sqoop将数据拉入HDFS,创建配置单元暂存表和归档外部表

Informatica是组织中使用的ETL工具

问候 桑吉布

  • Sqoop能够从Oracle/Teradata执行完全和增量加载
  • Sqoop从源系统并行复制数据
  • Sqoop脚本可以由Oozie自定义生成和调度
  • 任何规模集群的开源解决方案。无许可证费用
Informatica

  • ETL行业中管理映射的最佳界面
  • 不提供并行复制选项。为并行处理提供配置单元模式。基本上将转换转换转换为配置单元查询以供执行。还支持下推以生成MR代码
  • 每个节点的许可成本。如果您计划500个Hadoop节点用于未来的数据存储,那么在扩展集群时,您需要支付10倍于50个节点集群的费用
  • Informatica BDE是市场上相对较新的产品。INFA开发者将在大数据方面发挥作用。在Informatica上支持所有最新的Hadoop平台功能,以及Informatica BDE中的序列生成、状态映射、会话、查找转换等传统RDBMS功能,都存在挑战
  • Informatica MDM不支持Hadoop
如果价格是决策的标准,那么选择Sqoop。如果您想利用切换Hadoop plaftorm工具的灵活性,请使用Sqoop(Sqoop项目也在考虑跳过Spark)。 如果你因为某种原因与Informatica联系在一起,那么选择Informatica。但大多数Informatica开发人员希望转向Hadoop技术。

Sqoop

  • Sqoop能够从Oracle/Teradata执行完全和增量加载
  • Sqoop从源系统并行复制数据
  • Sqoop脚本可以由Oozie自定义生成和调度
  • 任何规模集群的开源解决方案。无许可证费用
Informatica

  • ETL行业中管理映射的最佳界面
  • 不提供并行复制选项。为并行处理提供配置单元模式。基本上将转换转换转换为配置单元查询以供执行。还支持下推以生成MR代码
  • 每个节点的许可成本。如果您计划500个Hadoop节点用于未来的数据存储,那么在扩展集群时,您需要支付10倍于50个节点集群的费用
  • Informatica BDE是市场上相对较新的产品。INFA开发者将在大数据方面发挥作用。在Informatica上支持所有最新的Hadoop平台功能,以及Informatica BDE中的序列生成、状态映射、会话、查找转换等传统RDBMS功能,都存在挑战
  • Informatica MDM不支持Hadoop
如果价格是决策的标准,那么选择Sqoop。如果您想利用切换Hadoop plaftorm工具的灵活性,请使用Sqoop(Sqoop项目也在考虑跳过Spark)。 如果你因为某种原因与Informatica联系在一起,那么选择Informatica。但大多数Informatica开发人员希望转向Hadoop技术。

Sqoop

  • Sqoop能够从Oracle/Teradata执行完全和增量加载
  • Sqoop从源系统并行复制数据
  • Sqoop脚本可以由Oozie自定义生成和调度
  • 任何规模集群的开源解决方案。无许可证费用
Informatica

  • ETL行业中管理映射的最佳界面
  • 不提供并行复制选项。为并行处理提供配置单元模式。基本上将转换转换转换为配置单元查询以供执行。还支持下推以生成MR代码
  • 每个节点的许可成本。如果您计划500个Hadoop节点用于未来的数据存储,那么在扩展集群时,您需要支付10倍于50个节点集群的费用
  • Informatica BDE是市场上相对较新的产品。INFA开发者将在大数据方面发挥作用。在Informatica上支持所有最新的Hadoop平台功能,以及Informatica BDE中的序列生成、状态映射、会话、查找转换等传统RDBMS功能,都存在挑战
  • Informatica MDM不支持Hadoop
如果价格是决策的标准,那么选择Sqoop。如果您想利用切换Hadoop plaftorm工具的灵活性,请使用Sqoop(Sqoop项目也在考虑跳过Spark)。 如果你因为某种原因与Informatica联系在一起,那么选择Informatica。但大多数Informatica开发人员希望转向Hadoop技术。

Sqoop

  • Sqoop能够从Oracle/Teradata执行完全和增量加载
  • Sqoop从源系统并行复制数据
  • Sqoop脚本可以由Oozie自定义生成和调度
  • 任何规模集群的开源解决方案。无许可证费用
Informatica

  • ETL行业中管理映射的最佳界面
  • 不提供并行复制选项。为并行处理提供配置单元模式。基本上将转换转换转换为配置单元查询以供执行。还支持下推以生成MR代码
  • 每个节点的许可成本。如果您计划500个Hadoop节点用于未来的数据存储,那么在扩展集群时,您需要支付10倍于50个节点集群的费用
  • Informatica BDE是市场上相对较新的产品。INFA开发人员将