Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/hadoop/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 比较文件中的差异_Java_Hadoop_Diff - Fatal编程技术网

Java 比较文件中的差异

Java 比较文件中的差异,java,hadoop,diff,Java,Hadoop,Diff,我有一个应用程序可以找出两个文件夹之间的差异。它提供在新文件夹中修改的所有文件的报告。创建的报告是一个html报告,它显示了差异。到目前为止,我已经用普通java实现了它,并在部署在tomcat上的spring框架中创建了一个web应用程序,它运行良好 现在用户群如此之大,以至于人们开始提供1GB的文件夹。我的申请书就这样消失了。目前在我的核心逻辑中,我将文件作为一个字符串数组,然后将每个数组元素与第二个数组中相应的数组元素进行比较,并有一个处理添加和删除的算法 我想让我的应用程序支持GB的数据

我有一个应用程序可以找出两个文件夹之间的差异。它提供在新文件夹中修改的所有文件的报告。创建的报告是一个html报告,它显示了差异。到目前为止,我已经用普通java实现了它,并在部署在tomcat上的spring框架中创建了一个web应用程序,它运行良好

现在用户群如此之大,以至于人们开始提供1GB的文件夹。我的申请书就这样消失了。目前在我的核心逻辑中,我将文件作为一个字符串数组,然后将每个数组元素与第二个数组中相应的数组元素进行比较,并有一个处理添加和删除的算法

我想让我的应用程序支持GB的数据,并找出其中的差异。我不确定这在Java中是否很容易实现。我对Hadoop只有一个基本的概念。使用Hadoop真的有可能吗。是否有一个指针,我可以从它开始构建应用程序

---------添加有关应用程序的更多信息-----------------


我们的产品应用程序确实包含很多元数据xml文件。某些bug可能会损坏xml文件。在这些情况下,临时解决方案是提供清理(纠正损坏的XML)。为了跟踪这个清理活动,我们有一个工具,它要求进行清理的开发人员提供旧的元数据文件夹和清理后的元数据文件夹。我们根据此创建审查报告,并将其提交给管理周期进行审查和批准

提前谢谢你的帮助


B1

要想知道它在Hadoop中是否有意义,需要更详细地了解该应用程序正在做什么。我们的产品应用程序确实包含大量元数据xml文件。某些bug可能会损坏xml文件。在这些情况下,临时解决方案是提供清理(纠正损坏的XML)。为了跟踪这个清理活动,我们有一个工具,它要求进行清理的开发人员提供旧的元数据文件夹和清理后的元数据文件夹。我们根据此创建审查报告,并将其提交给管理周期进行审查和批准。如果不清楚,请告诉我。