Java侦察任务-最快的通用解决方案

Java侦察任务-最快的通用解决方案,java,oracle,mongodb,bigdata,Java,Oracle,Mongodb,Bigdata,目前,我正在RDS中运行我的应用程序,并正在迁移到MongoDB。现在,我们有一个同步作业,当行被添加/修改或删除时,将数据从Oracle同步到Mongo。 写入仅在Oracle上发生 计划完成一项侦察任务,比较源数据和目标数据。我正在尝试进行完整的重新确认,从oracle获取所有数据,然后与MongoDB进行比较,以找到重复性 我计划采用以下方法 注意,oracle数据库的大小可能以TB为单位 1) 从oracle表A中获取前1000行(简单的JDBC结果方法) 2) 对于每个条目,创建键值的

目前,我正在RDS中运行我的应用程序,并正在迁移到MongoDB。现在,我们有一个同步作业,当行被添加/修改或删除时,将数据从Oracle同步到Mongo。 写入仅在Oracle上发生

计划完成一项侦察任务,比较源数据和目标数据。我正在尝试进行完整的重新确认,从oracle获取所有数据,然后与MongoDB进行比较,以找到重复性

我计划采用以下方法

注意,oracle数据库的大小可能以TB为单位

1) 从oracle表A中获取前1000行(简单的JDBC结果方法)

2) 对于每个条目,创建键值的映射。(地图)

3) 从MongoDB获取相应的数据,并基于oracle格式转换数据

4) 对于每个条目,创建键值的映射

5) 比较这两张地图,看看它们是否相同。(Oracle映射等于数据库映射)

6) 对下一行重复相同的操作

但是,即使我使用多线程,这种方法也要花费很多时间。我对大数据没有太多想法,但对新想法持开放态度

这里有没有其他方法或技术可以用于并行处理

注意,可能存在一些直接映射到oracle和Mongo的表。Mongo中很少有非规范化的表


谢谢,

你说的“侦察”是什么意思?谢谢,我是说你的工作。