Hadoop 我们如何使用SQoop对从RDBMS迁移到HDFS的数据进行测试?

Hadoop 我们如何使用SQoop对从RDBMS迁移到HDFS的数据进行测试?,hadoop,testing,hdfs,sqoop,bigdata,Hadoop,Testing,Hdfs,Sqoop,Bigdata,测试人员如何测试数据是否从RDBMS移动到HDFS?请仅从测试角度进行解释 将数据从RDBMS移动到HDFS和将数据从RDBMS移动到HIVE之间有什么区别?我知道HIVE不是数据库,那么为什么要将数据移动到HIVE呢 这个话题相当大。我会尽量简单地回答 测试人员如何测试数据是否从RDBMS移动到HDFS?请 仅从测试角度进行解释 这就是我们过去所做的。一旦迁移活动发生。我们编写了一系列测试脚本,其中我们用大量随机记录轮询了RDBMS。从每个记录中准备主键,然后在配置单元表上搜索这些主键,并对两

测试人员如何测试数据是否从RDBMS移动到HDFS?请仅从测试角度进行解释

  • 将数据从RDBMS移动到HDFS和将数据从RDBMS移动到HIVE之间有什么区别?我知道HIVE不是数据库,那么为什么要将数据移动到HIVE呢


  • 这个话题相当大。我会尽量简单地回答

    测试人员如何测试数据是否从RDBMS移动到HDFS?请 仅从测试角度进行解释

    这就是我们过去所做的。一旦迁移活动发生。我们编写了一系列测试脚本,其中我们用大量随机记录轮询了RDBMS。从每个记录中准备主键,然后在配置单元表上搜索这些主键,并对两个结果集进行头对头匹配

    将数据从RDBMS移动到HDFS和将数据从RDBMS移动到HIVE之间有什么区别?我知道HIVE不是数据库,那么为什么要将数据移动到HIVE呢

    将数据移动到HDFS时,将整个数据集存储到FS(即文件系统)中。Hive只是一个Sql包装器,它使用相同的文件,并为您提供一个Sql接口来读/写相同的数据。 配置单元不是实际的数据库,但可以用作数据库

    假设您的底层文件是一个简单的csv。配置单元在创建配置单元表时,您可以提供delimeter、文件名、列信息和几个其他参数,配置单元将表示同一个文件,就像它是一个表一样


    之后,您可以从配置单元表中添加/删除/更新记录,或直接编辑CSV。

    感谢您的回复。您能告诉我下面的场景吗:假设开发人员使用sqoop将数据从RDBMS迁移到HDFS。现在我要测试的是什么?我将如何测试迁移的数据?我们是否也使用sqoop来测试同样的问题?如果是,那怎么办?