Amazon web services CoreOS部分集群更新

Amazon web services CoreOS部分集群更新,amazon-web-services,coreos,Amazon Web Services,Coreos,我正在尝试在VPC内的AWS EC2实例上设置一个小型CoreOS集群。 在本练习中,我将使用两个自动缩放组,其中一个是3台机器中的一台,它们将形成core etcd和Consor群集,然后是第二个自动缩放组,当前有一个节点,该节点将随着应用程序的增长而实际扩展。它们都在一个共同的etcd集群中 本周,coreos.com向stable branch发布了build 681,其中一个节点立即更新为681.0,但48小时后,主集群中的3个节点仍保留在版本647.2上。当我查看日志时,我看到以下内容

我正在尝试在VPC内的AWS EC2实例上设置一个小型CoreOS集群。 在本练习中,我将使用两个自动缩放组,其中一个是3台机器中的一台,它们将形成core etcd和Consor群集,然后是第二个自动缩放组,当前有一个节点,该节点将随着应用程序的增长而实际扩展。它们都在一个共同的etcd集群中

本周,coreos.com向stable branch发布了build 681,其中一个节点立即更新为681.0,但48小时后,主集群中的3个节点仍保留在版本647.2上。当我查看日志时,我看到以下内容:

Jun 11 14:25:17 ip-10-0-68-116.ec2.internal update_engine[477]: [0611/142517:INFO:libcurl_http_fetcher.cc(48)] Starting/Resuming transfer
Jun 11 14:25:17 ip-10-0-68-116.ec2.internal update_engine[477]: [0611/142517:INFO:libcurl_http_fetcher.cc(164)] Setting up curl options for HTTPS
Jun 11 14:25:17 ip-10-0-68-116.ec2.internal update_engine[477]: [0611/142517:INFO:libcurl_http_fetcher.cc(427)] Setting up timeout source: 1 seconds.
Jun 11 14:25:17 ip-10-0-68-116.ec2.internal update_engine[477]: [0611/142517:INFO:libcurl_http_fetcher.cc(240)] HTTP response code: 200
Jun 11 14:25:17 ip-10-0-68-116.ec2.internal update_engine[477]: [0611/142517:INFO:libcurl_http_fetcher.cc(297)] Transfer completed (200), 267 bytes downloaded
Jun 11 14:25:17 ip-10-0-68-116.ec2.internal update_engine[477]: [0611/142517:INFO:omaha_request_action.cc(574)] Omaha request response: <?xml version="1.0" encoding="UTF-8"?>
Jun 11 14:25:17 ip-10-0-68-116.ec2.internal update_engine[477]: <response protocol="3.0" server="update.core-os.net">
Jun 11 14:25:17 ip-10-0-68-116.ec2.internal update_engine[477]: <daystart elapsed_seconds="0"></daystart>
Jun 11 14:25:17 ip-10-0-68-116.ec2.internal update_engine[477]: <app appid="e96281a6-xxxx-xxxx-xxxx-xxxxxxxxxxxx" status="ok">
Jun 11 14:25:17 ip-10-0-68-116.ec2.internal update_engine[477]: <updatecheck status="noupdate"></updatecheck>
Jun 11 14:25:17 ip-10-0-68-116.ec2.internal update_engine[477]: </app>
Jun 11 14:25:17 ip-10-0-68-116.ec2.internal update_engine[477]: </response>

一周后更新:群集仍处于半升级状态。如果有人有任何经验,我很想知道如何调试此类问题。

如评论中所述,在这种情况下,机器可能收到更新,在查看故障数量后,CoreOS团队决定停止向更多主机推出更新,以避免造成更多故障

如果要强制执行更新检查,可以运行:

$ update_engine_client -check_for_update
[0123/220706:INFO:update_engine_client.cc(245)] Initiating update check and install.

有关更多详细信息,请参阅CoreOS因错误退出681版本。ref:“稳定频道当前已暂停(我们收到了一些太多的错误报告)。更新引擎正确地报告没有可用的升级。如果您确实想尝试新的稳定频道,可以使用最新映像配置新实例。请在稳定频道有新的升级版本时重试,因为从技术上讲,647是目前最新的稳定版本。您可以使用
update\u engine\u client-check\u for\u update
强制执行更新检查。非常感谢您的澄清。CoreOS 681.2.0已经发布,修复了许多问题。您现在应该能够成功更新,但需要将您的681系统更新为681.2才能使它们同步。我看到了681.2版本。今天早上有两台机器在新的681.2上(一台最初在681.0上,第一台在647.2上),现在几个小时后,最后两台机器仍然在647.2上。。。我想知道681.2是否也停止了?但是在运行
update\u engine\u client-检查\u是否有更新后
我看到下载已在机器3上启动。
$ update_engine_client -check_for_update
[0123/220706:INFO:update_engine_client.cc(245)] Initiating update check and install.