如何在云计算或超级计算机中执行Java应用程序

如何在云计算或超级计算机中执行Java应用程序,java,eclipse,cloud,Java,Eclipse,Cloud,我用java(eclipse)开发了一个应用程序来解析XML文件(大约400个),将它们存储在数据库对象(neodatis)中,然后计算这些文件之间的相似性。但是当运行我的电脑时,它是一个快速犁。 有人建议我转向云计算(WindowsAzure、亚马逊EC2、谷歌应用引擎等)。 你怎么认为?我也认为超级计算机! 谢谢。比较400个XML文档肯定不是超级计算机的领域。也许一次推一个集群就好了,但实际上一个桌面应该能够做到这一点。如果我是你,我会首先考虑优化你的代码,这样它就可以在桌面上处理400个

我用java(eclipse)开发了一个应用程序来解析XML文件(大约400个),将它们存储在数据库对象(neodatis)中,然后计算这些文件之间的相似性。但是当运行我的电脑时,它是一个快速犁。 有人建议我转向云计算(WindowsAzure、亚马逊EC2、谷歌应用引擎等)。 你怎么认为?我也认为超级计算机!
谢谢。

比较400个XML文档肯定不是超级计算机的领域。也许一次推一个集群就好了,但实际上一个桌面应该能够做到这一点。如果我是你,我会首先考虑优化你的代码,这样它就可以在桌面上处理400个文档。这是可能的


效率低下的一个可能原因可能是您正在执行N2比较操作,但扩展性不好。也许你可以看看一些图形/聚类算法,以减少需要进行比较的次数。

只是为了支持@Joe:如果计算需要几个小时,请不要惊慌。我可以想象,这是一项一次性任务,在你没有经验的情况下,将这样的东西移动到云端将很快需要好几天的时间。因此,即使你的计算需要几天时间,你仍然会更快。也许可以添加一些进度报告,这样你就可以估计进度有多快。这是真的。此外,没有什么比看到代码处理数据更令人满意的了!谢谢你的帮助。但我把这些文档作为树的比较,有时每棵树有50条路径!!!一棵树(两棵树)需要8小时,所以400棵树是不可能的。如何优化我的代码?感谢lotWell,您可以尝试将树拆分为子树以进行比较,或者在树遍历中控制回溯,或者创建不同位的部分哈希以进行快速比较。。。通常,在准确性和速度之间需要权衡。如果你不想要一个绝对精确的数字,你可以采取一些启发式的捷径。嗨,谢谢你的回答..但是我必须使用绝对精确的数字,所以我试图在网格计算中找到一个解决方案!!