Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/security/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Security 我应该使用哪个发行版(HDP或CDH)进行免费集群部署,重点是Spark和安全性?_Security_Hadoop_Apache Spark_Cloudera_Hortonworks Data Platform - Fatal编程技术网

Security 我应该使用哪个发行版(HDP或CDH)进行免费集群部署,重点是Spark和安全性?

Security 我应该使用哪个发行版(HDP或CDH)进行免费集群部署,重点是Spark和安全性?,security,hadoop,apache-spark,cloudera,hortonworks-data-platform,Security,Hadoop,Apache Spark,Cloudera,Hortonworks Data Platform,我是大数据的初学者,这对Quora来说可能是一个更大的问题,但我还是会继续拍摄。我必须建立一个实时数据流集群,严格遵守安全要求基于角色的访问、加密传输和存储。计划是使用ApacheKafka作为数据管道,将数据发送到Spark streaming,通过Spark streaming,我们运行一些分析或可视化等。因此,我想要回答的问题是 使用Cloudera、HortonWorks或DIY等现有发行版建立集群的最佳选择是什么?我想保持开源和免费,所以不寻找MapR。一个设置,是或可以与卡夫卡和火花

我是大数据的初学者,这对Quora来说可能是一个更大的问题,但我还是会继续拍摄。我必须建立一个实时数据流集群,严格遵守安全要求基于角色的访问、加密传输和存储。计划是使用ApacheKafka作为数据管道,将数据发送到Spark streaming,通过Spark streaming,我们运行一些分析或可视化等。因此,我想要回答的问题是

使用Cloudera、HortonWorks或DIY等现有发行版建立集群的最佳选择是什么?我想保持开源和免费,所以不寻找MapR。一个设置,是或可以与卡夫卡和火花集成是我在这里寻找。 对于上面建议的基于角色的访问和所有层的加密,分发版的安全实现是什么 添加了安全功能后会带来什么开销? 如何对这样的集群进行基准测试或测试,即任何链接、教程指南和虚拟设置? 如果我使用Cloudera Manager Express购买Cloudera的CDH 5,我将无法在集群中集成哪些功能;与Cloudera Manager企业版相反?
对于您的疑问,您可能会找到一些答案:谢谢,见解深刻,但是这里的结论似乎是MapR,它是一种企业产品。在这两个发行版中,有关于这个特定用例的线索吗?为什么投反对票,请至少解释一下,它需要一些必要的访问。当我刚开始使用stackoverflow时,我就面临过这种投票。。如果一个问题太宽泛&可能有多个答案,那么其他人会投反对票。有时这些问题将被关闭和删除。在此基础上,本网站的一些访问者可能会否决您的问题。