如何在云计算或超级计算机中执行Java应用程序_Java_Eclipse_Cloud

如何在云计算或超级计算机中执行Java应用程序

java eclipse cloud

如何在云计算或超级计算机中执行Java应用程序,java,eclipse,cloud,Java,Eclipse,Cloud,我用java（eclipse）开发了一个应用程序来解析XML文件（大约400个），将它们存储在数据库对象（neodatis）中，然后计算这些文件之间的相似性。但是当运行我的电脑时，它是一个快速犁。有人建议我转向云计算（WindowsAzure、亚马逊EC2、谷歌应用引擎等）。你怎么认为？我也认为超级计算机！谢谢。比较400个XML文档肯定不是超级计算机的领域。也许一次推一个集群就好了，但实际上一个桌面应该能够做到这一点。如果我是你，我会首先考虑优化你的代码，这样它就可以在桌面上处理400个

我用java（eclipse）开发了一个应用程序来解析XML文件（大约400个），将它们存储在数据库对象（neodatis）中，然后计算这些文件之间的相似性。但是当运行我的电脑时，它是一个快速犁。有人建议我转向云计算（WindowsAzure、亚马逊EC2、谷歌应用引擎等）。你怎么认为？我也认为超级计算机！

谢谢。

比较400个XML文档肯定不是超级计算机的领域。也许一次推一个集群就好了，但实际上一个桌面应该能够做到这一点。如果我是你，我会首先考虑优化你的代码，这样它就可以在桌面上处理400个文档。这是可能的

效率低下的一个可能原因可能是您正在执行N2比较操作，但扩展性不好。也许你可以看看一些图形/聚类算法，以减少需要进行比较的次数。

只是为了支持@Joe：如果计算需要几个小时，请不要惊慌。我可以想象，这是一项一次性任务，在你没有经验的情况下，将这样的东西移动到云端将很快需要好几天的时间。因此，即使你的计算需要几天时间，你仍然会更快。也许可以添加一些进度报告，这样你就可以估计进度有多快。这是真的。此外，没有什么比看到代码处理数据更令人满意的了！谢谢你的帮助。但我把这些文档作为树的比较，有时每棵树有50条路径！！！一棵树（两棵树）需要8小时，所以400棵树是不可能的。如何优化我的代码？感谢lotWell，您可以尝试将树拆分为子树以进行比较，或者在树遍历中控制回溯，或者创建不同位的部分哈希以进行快速比较。。。通常，在准确性和速度之间需要权衡。如果你不想要一个绝对精确的数字，你可以采取一些启发式的捷径。嗨，谢谢你的回答..但是我必须使用绝对精确的数字，所以我试图在网格计算中找到一个解决方案！！