Python包安装:pip vs yum,还是两者同时安装?

Python包安装:pip vs yum,还是两者同时安装?,python,hadoop,pip,yum,Python,Hadoop,Pip,Yum,我刚刚开始管理Hadoop集群。我们使用的是高达O/S级别的Bright Cluster Manager(CentOS 7.1),然后是Ambari以及Hadoop的Hortonworks HDP 2.3 我不断收到安装新python模块的请求。我们在安装时使用yum安装了一些模块,随着集群的发展,使用pip安装了一些模块 “正确”的方法是什么?始终使用yum,但不能提供最新和最好的模块?始终使用pip,而不使用一点真相(yum)显示安装了哪些软件包?或者同时使用pip和yum可以吗 我只是担心

我刚刚开始管理Hadoop集群。我们使用的是高达O/S级别的Bright Cluster Manager(CentOS 7.1),然后是Ambari以及Hadoop的Hortonworks HDP 2.3

我不断收到安装新python模块的请求。我们在安装时使用yum安装了一些模块,随着集群的发展,使用pip安装了一些模块

“正确”的方法是什么?始终使用yum,但不能提供最新和最好的模块?始终使用pip,而不使用一点真相(yum)显示安装了哪些软件包?或者同时使用pip和yum可以吗


我只是担心我正在用垃圾和太多版本的python模块填充系统。有什么建议吗?

作为发行版一部分的软件包应该是首选,因为它们已经过测试,可以在您的系统上正常工作。这些软件包在系统范围内安装

但是,如果没有提供合适的RPM软件包,请继续使用
pip
从PyPi或github安装,但尽可能部署虚拟Python环境。使用virtual envs,您不必在系统范围内安装第三方软件包。您将拥有几个较小的包集,这些包集作为一个包集更易于管理。

最好使用单独的python(不要与系统python混淆),并在其上使用pip来管理具有精确版本的python模块。因为您正在为hadoop管理集群。。你也可以自动安装。你说的“独立python”是什么意思?您的意思是从头开始安装python,而不是使用CentOS提供的yum软件包?是的,我们正在自动化安装。在Bright Cluster Manager中,我可以在基本映像中安装软件/模块,然后更新所有节点。我想,“分离python”意味着使用virtualenv。