Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/amazon-web-services/12.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Amazon web services 具有重叠EC2实例的集群_Amazon Web Services_Hadoop_Apache Spark_Amazon Ec2_Yarn - Fatal编程技术网

Amazon web services 具有重叠EC2实例的集群

Amazon web services 具有重叠EC2实例的集群,amazon-web-services,hadoop,apache-spark,amazon-ec2,yarn,Amazon Web Services,Hadoop,Apache Spark,Amazon Ec2,Yarn,我有以下具有重叠EC2实例的集群,例如:纱线集群和Memcached集群使用相同的实例2、3、4;此外,每个实例都有不同的RAM、CPU、内核大小,这会不会有潜在的问题?或者群集可以自行平衡?谢谢 火花簇:EC2实例2、3、5 纱线簇:EC2实例1、2、3、4、5 Memcached数据库集群:EC2实例2,3,4,6 instance 1: 512GB RAM, 2 vCPU, 2 cores instance 2: 1TB RAM, 8 vCPU, 4 cores ins

我有以下具有重叠EC2实例的集群,例如:纱线集群和Memcached集群使用相同的实例2、3、4;此外,每个实例都有不同的RAM、CPU、内核大小,这会不会有潜在的问题?或者群集可以自行平衡?谢谢

火花簇:EC2实例2、3、5
纱线簇:EC2实例1、2、3、4、5
Memcached数据库集群:EC2实例2,3,4,6

instance 1: 512GB RAM, 2 vCPU,  2 cores  
instance 2: 1TB RAM,   8 vCPU,  4 cores    
instance 3: 2TB RAM,   6 vCPU,  6 cores    
instance 4: 256GB RAM, 2 vCPU,  2 cores  
instance 5: 2TB RAM,   16 vCPU, 4 cores    
instance 6: 4TB RAM,   4 vCPU,  8 cores 

集群不知道这种共享;您需要配置每个主机的资源分配,以避免过度承诺

如果对于任何节点,总资源分配使超过所有RAM/内核/磁盘可用,则您将面临风险(通常情况下,存在spark任务或子线程无法启动的风险)。例如,3您不能为每个服务分配1T

比如,在实例3中,您不能为每个服务分配1T


作为补充说明,Spark可以在纱线上运行,因此有一个选项可以将其减少为两个簇。

谢谢@patrungel,我可以了解最后一句的更多细节吗?你的意思是火花簇和纱线簇可以共享同一个簇机器吗?就像100%重叠一样?Spark可以作为一个Thread应用程序运行(也就是说,它可以将Thread用作其作业的资源管理器),因此我们不是在谈论重叠,而是在hadoop(mapred)和Spark作业中使用相同的集群。在这种情况下,mapred和spark作业受公共调度的约束,因此不需要处理两个不相关的集群。这是一个非常常见的设置,请参阅将spark添加到现有的纱线簇是一个相当简单的任务。