Cloud foundry 如何解决无响应/失败的bosh lite cloud foundry虚拟机?
我(试图!)在MacBookPro上使用bosh lite学习云铸造。 我设法让它运行,但每次从零开始它就停止工作,我怀疑这与停止[virtualbox]虚拟机/让笔记本电脑进入睡眠有关,但无法确认是否确实如此 我的经验是有限的,我不仅在解决问题上有困难,而且在理解哪里出了问题上也有困难。 如果这是一个明显的问题,我深表歉意,但我无法清楚地确定如何阻止此问题的发生,到目前为止,我唯一的解决方案是使用Vagrant销毁部署,然后从头开始—这需要一段时间,而且我肯定不是最佳的修复方法。:) 我注意到“波什虚拟机”显示的是反应迟钝的代理,而且他们没有正确地盯着。bosh cck中的错误表明存在锁定问题,但我怀疑这可能是一个误称,因为运行bosh locks表明没有锁定。再一次,我是个新手,所以这可能只是一个误会 帮助-如何修复此问题!!有没有办法快速“重置”到工作状态?(流浪者重新装载——规定没有帮助) 问题到底在哪里 另外,vagrant cloudfoundry/bosh lite虚拟机的(默认)根密码是什么Cloud foundry 如何解决无响应/失败的bosh lite cloud foundry虚拟机?,cloud-foundry,cf-bosh,Cloud Foundry,Cf Bosh,我(试图!)在MacBookPro上使用bosh lite学习云铸造。 我设法让它运行,但每次从零开始它就停止工作,我怀疑这与停止[virtualbox]虚拟机/让笔记本电脑进入睡眠有关,但无法确认是否确实如此 我的经验是有限的,我不仅在解决问题上有困难,而且在理解哪里出了问题上也有困难。 如果这是一个明显的问题,我深表歉意,但我无法清楚地确定如何阻止此问题的发生,到目前为止,我唯一的解决方案是使用Vagrant销毁部署,然后从头开始—这需要一段时间,而且我肯定不是最佳的修复方法。:) 我注意到
> bosh vms
+---------------------------------------------------------------------------+--------------------+-----+-----------+--------------+
| VM | State | AZ | VM Type | IPs |
+---------------------------------------------------------------------------+--------------------+-----+-----------+--------------+
| api_z1/0 (8dfeb143-59b1-46dd-9482-e90931a70a0d) | unresponsive agent | n/a | large_z1 | 10.244.0.138 |
| blobstore_z1/0 (7795ce02-d64e-4cc7-be1e-0e328384d568) | unresponsive agent | n/a | medium_z1 | 10.244.0.130 |
| consul_z1/0 (e92f6bfd-f623-4ba4-abf3-3d4baa0953fa) | unresponsive agent | n/a | small_z1 | 10.244.0.54 |
| doppler_z1/0 (049eaa18-3d4f-48d8-92ed-ea4b6a20cd29) | unresponsive agent | n/a | medium_z1 | 10.244.0.146 |
| etcd_z1/0 (e45a7648-e43d-4753-8a18-3ab21b86293d) | unresponsive agent | n/a | large_z1 | 10.244.0.42 |
| ha_proxy_z1/0 (ba6e8ce6-8f40-4868-8a71-c74119f173ea) | failing | n/a | router_z1 | 10.244.0.34 |
| hm9000_z1/0 (ff8ae6a3-1889-4fb0-aabf-072012cf9f48) | unresponsive agent | n/a | medium_z1 | 10.244.0.142 |
| loggregator_trafficcontroller_z1/0 (8f2e4ea1-dda7-4d15-9050-528338824e3b) | unresponsive agent | n/a | small_z1 | 10.244.0.150 |
| nats_z1/0 (9e4eab32-ac91-4f05-83be-b8189c2991e7) | unresponsive agent | n/a | medium_z1 | 10.244.0.6 |
| postgres_z1/0 (fb8d1eee-3ade-480e-aa01-3db26a64b447) | unresponsive agent | n/a | medium_z1 | 10.244.0.30 |
| router_z1/0 (f9ce017b-580f-4fce-b79d-01ceef190e19) | unresponsive agent | n/a | router_z1 | 10.244.0.22 |
| runner_z1/0 (c0b0871b-c672-46c8-ac4a-1aabd81864f6) | unresponsive agent | n/a | runner_z1 | 10.244.0.26 |
| uaa_z1/0 (63b4bfa7-499d-4dba-93f6-2017b04a7588) | unresponsive agent | n/a | medium_z1 | 10.244.0.134 |
+---------------------------------------------------------------------------+--------------------+-----+-----------+--------------+
> bosh cck
Acting as user 'admin' on deployment 'cf-warden' on 'Bosh Lite Director'
Performing cloud check...
Director task 96
Error 100: Unable to get deployment lock, maybe a deployment is in progress. Try again later.
Task 96 error
For a more detailed error report, run: bosh task 96 --debug
> bosh locks
Acting as user 'admin' on 'Bosh Lite Director'
No locks
可以使用下面的命令执行“重置”并使其重新启动和运行,但这需要相当长的时间,而且肯定比需要的更像“锤子”
# bosh-lite dir
vagrant destroy && vagrant up
# cd cf-release dir
bosh upload release
bosh deploy
# cd bosh-lite dir
bin/add-route
cf api --skip-ssl-validation https://api.bosh-lite.com
cf create-org my_org
cf create-space development -o my_org
您可以在使用
vagrant ssh
ssh进入bosh lite VM后使用sudo su
成为root用户,而无需输入root密码
在VM重新启动/睡眠后,BOSH lite一直很难恢复。最近有人(2016年12月)编写了一个实用程序“优雅地将运行BOSH Lite的机器置于睡眠状态”,并在系统唤醒时将其恢复,以解决此问题:
我通常先执行
vagrant suspend
,然后执行vagrant up
,以避免在BOSH Lite中出现容器/虚拟机死机的情况
您可以执行
bosh cck
,但我的经验表明,简单的部署重建速度更快,也更可靠。建议我们在不使用bosh lite VM时暂停它,以便在系统进入睡眠/重新启动后可以简单地恢复它;否则VM将被OS停止(Bosh lite VM处于中止状态)。在中止的bosh lite上运行vagrant up
,使其运行,但在这种情况下,CF VM处于无响应状态,需要重新部署
重新启动工作时运行
vagrant suspend
暂停和vagrant resume
,有助于避免CF VM无响应的情况 似乎在一个新的部署之后,仅仅运行vagrant reload——provision将破坏它。我不能给你一个完整的答案,但是当你重新启动或停止时,那么打开bosh lite VM,任何现有的作业都将丢失。这是因为bosh lite将作业部署到VM上的容器中,而这些容器在重新启动后不会重新启动。最简单的恢复和运行方法通常是boshcck
。它将检测到容器已关闭,并允许您重新创建它们。锁错误有点令人惊讶。您可以再次运行它,看看是否一直出现锁错误。您也可以尝试禁用resurrector,看看这是否有帮助。有时这会锁定部署。我也在使用vagrant suspend
但是vagrant resume
。或者,要修复构建,bosh cck