Python Hadoop Vs.Disco Vs.Condor?
我试图找到一个工具,可以管理集群中100台机器上的一系列作业(将作业提交给机器;确保作业已运行等) 哪种工具更易于安装/管理:Python Hadoop Vs.Disco Vs.Condor?,python,distributed-computing,Python,Distributed Computing,我试图找到一个工具,可以管理集群中100台机器上的一系列作业(将作业提交给机器;确保作业已运行等) 哪种工具更易于安装/管理: (1)Hadoop? (2)迪斯科? (3)秃鹰? 理想情况下,我正在寻找一个尽可能简单但又健壮的解决方案。 Python集成也是一个优势。我不熟悉Disco和Condor,但我可以回答关于Hadoop的问题: Hadoop的优点: 强健且经验证——可能比其他任何东西都要强大。许多组织(包括我工作的组织)都使用它来运行由100多个节点组成的集群 大型生态系统=支持+多
(1)Hadoop?
(2)迪斯科?
(3)秃鹰?
理想情况下,我正在寻找一个尽可能简单但又健壮的解决方案。
Python
集成也是一个优势。我不熟悉Disco和Condor,但我可以回答关于Hadoop的问题:
Hadoop的优点:
- 强健且经验证——可能比其他任何东西都要强大。许多组织(包括我工作的组织)都使用它来运行由100多个节点组成的集群
- 大型生态系统=支持+多个子项目,使生活更轻松(如猪、蜂巢)
- Python支持应该可以通过streamingMR特性实现,或者Jython
- 既不简单也不优雅(imho)。你得花时间学习