用于aws cloudformation模板的nvidia docker。Ec2实例不断关闭
我已经更改了docker for aws cloudformation模板,将ami更改为nvidia docker的可用性,并将实例类型更改为g3.4XL。我还做了很多其他的调整 当我创建堆栈时,我可以ssh到一个实例中,docker swarm被初始化并可以访问所有节点。没有错误日志。但是,EC2实例会定期关闭,而终止实例的系统日志中没有任何信息日志 我想知道是否有人知道为什么会发生这种情况 以下是我的cloudformation模板: pastebin.com/5465RgSN 最新澄清:用于aws cloudformation模板的nvidia docker。Ec2实例不断关闭,docker,amazon-ec2,amazon-cloudformation,docker-swarm,nvidia-docker,Docker,Amazon Ec2,Amazon Cloudformation,Docker Swarm,Nvidia Docker,我已经更改了docker for aws cloudformation模板,将ami更改为nvidia docker的可用性,并将实例类型更改为g3.4XL。我还做了很多其他的调整 当我创建堆栈时,我可以ssh到一个实例中,docker swarm被初始化并可以访问所有节点。没有错误日志。但是,EC2实例会定期关闭,而终止实例的系统日志中没有任何信息日志 我想知道是否有人知道为什么会发生这种情况 以下是我的cloudformation模板: pastebin.com/5465RgSN 最新澄清:
堆栈应该创建3个节点(3个管理器,0个工作器)。在创建堆栈几分钟后,EC2实例开始关闭,取而代之的是,新实例被创建并加入swarm。当我ssh到EC2实例中时,通常有2-3分钟的时间,直到它关闭。你能更好地描述一下你所说的周期性吗?实例是否被替换?我在cloudformation模板中看到定义了生命周期挂钩和swarm cleanup。你所经历的可能是你想要的行为吗?我已经用最新的澄清编辑了这篇文章。我相信这样做的目的是,如果其中一个节点发生故障,就应该创建新实例。但是,我不知道为什么节点会自动关闭。你能共享CloudFormation文件吗?你可以在这里找到它:pastebin.com/5465rgsn问题已经解决。ELB健康检查向未打开的端口发出http请求。将ELB运行状况检查目标从HTTP:44554更改为TCP:22。现在工作