Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/283.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python Hadoop Vs.Disco Vs.Condor?_Python_Distributed Computing - Fatal编程技术网

Python Hadoop Vs.Disco Vs.Condor?

Python Hadoop Vs.Disco Vs.Condor?,python,distributed-computing,Python,Distributed Computing,我试图找到一个工具,可以管理集群中100台机器上的一系列作业(将作业提交给机器;确保作业已运行等) 哪种工具更易于安装/管理: (1)Hadoop? (2)迪斯科? (3)秃鹰? 理想情况下,我正在寻找一个尽可能简单但又健壮的解决方案。 Python集成也是一个优势。我不熟悉Disco和Condor,但我可以回答关于Hadoop的问题: Hadoop的优点: 强健且经验证——可能比其他任何东西都要强大。许多组织(包括我工作的组织)都使用它来运行由100多个节点组成的集群 大型生态系统=支持+多

我试图找到一个工具,可以管理集群中100台机器上的一系列作业(将作业提交给机器;确保作业已运行等)

哪种工具更易于安装/管理:

(1)Hadoop?

(2)迪斯科?

(3)秃鹰?

理想情况下,我正在寻找一个尽可能简单但又健壮的解决方案。
Python
集成也是一个优势。

我不熟悉Disco和Condor,但我可以回答关于Hadoop的问题:

Hadoop的优点:

  • 强健且经验证——可能比其他任何东西都要强大。许多组织(包括我工作的组织)都使用它来运行由100多个节点组成的集群
  • 大型生态系统=支持+多个子项目,使生活更轻松(如猪、蜂巢)
  • Python支持应该可以通过streamingMR特性实现,或者Jython
Hadoop缺点:

  • 既不简单也不优雅(imho)。你得花时间学习

您考虑过Sun Grid引擎吗

大型生态系统还意味着教程和答案。对hadoop来说,提问(并得到答案)的机会真的是一个好机会。@extranon绝对是!谢谢你加上这个!猪是不洁的:-)因此我在寻找不同的解决方案。看起来Hadoop的安装/维护很复杂(特别是对于一个人的商店),因此,我想找一个更简单的东西来维护。Chag Pessach Sameach@user540009还可以查看GridGain。我过去使用它作为Hadoop的开发人员友好的替代品。查格·萨默奇。