Cloud foundry 如何解决无响应/失败的bosh lite cloud foundry虚拟机?

Cloud foundry 如何解决无响应/失败的bosh lite cloud foundry虚拟机?,cloud-foundry,cf-bosh,Cloud Foundry,Cf Bosh,我(试图!)在MacBookPro上使用bosh lite学习云铸造。 我设法让它运行,但每次从零开始它就停止工作,我怀疑这与停止[virtualbox]虚拟机/让笔记本电脑进入睡眠有关,但无法确认是否确实如此 我的经验是有限的,我不仅在解决问题上有困难,而且在理解哪里出了问题上也有困难。 如果这是一个明显的问题,我深表歉意,但我无法清楚地确定如何阻止此问题的发生,到目前为止,我唯一的解决方案是使用Vagrant销毁部署,然后从头开始—这需要一段时间,而且我肯定不是最佳的修复方法。:) 我注意到

我(试图!)在MacBookPro上使用bosh lite学习云铸造。 我设法让它运行,但每次从零开始它就停止工作,我怀疑这与停止[virtualbox]虚拟机/让笔记本电脑进入睡眠有关,但无法确认是否确实如此

我的经验是有限的,我不仅在解决问题上有困难,而且在理解哪里出了问题上也有困难。 如果这是一个明显的问题,我深表歉意,但我无法清楚地确定如何阻止此问题的发生,到目前为止,我唯一的解决方案是使用Vagrant销毁部署,然后从头开始—这需要一段时间,而且我肯定不是最佳的修复方法。:)

我注意到“波什虚拟机”显示的是反应迟钝的代理,而且他们没有正确地盯着。bosh cck中的错误表明存在锁定问题,但我怀疑这可能是一个误称,因为运行bosh locks表明没有锁定。再一次,我是个新手,所以这可能只是一个误会

帮助-如何修复此问题!!有没有办法快速“重置”到工作状态?(流浪者重新装载——规定没有帮助) 问题到底在哪里

另外,vagrant cloudfoundry/bosh lite虚拟机的(默认)根密码是什么

> bosh vms

+---------------------------------------------------------------------------+--------------------+-----+-----------+--------------+
| VM                                                                        | State              | AZ  | VM Type   | IPs          |
+---------------------------------------------------------------------------+--------------------+-----+-----------+--------------+
| api_z1/0 (8dfeb143-59b1-46dd-9482-e90931a70a0d)                           | unresponsive agent | n/a | large_z1  | 10.244.0.138 |
| blobstore_z1/0 (7795ce02-d64e-4cc7-be1e-0e328384d568)                     | unresponsive agent | n/a | medium_z1 | 10.244.0.130 |
| consul_z1/0 (e92f6bfd-f623-4ba4-abf3-3d4baa0953fa)                        | unresponsive agent | n/a | small_z1  | 10.244.0.54  |
| doppler_z1/0 (049eaa18-3d4f-48d8-92ed-ea4b6a20cd29)                       | unresponsive agent | n/a | medium_z1 | 10.244.0.146 |
| etcd_z1/0 (e45a7648-e43d-4753-8a18-3ab21b86293d)                          | unresponsive agent | n/a | large_z1  | 10.244.0.42  |
| ha_proxy_z1/0 (ba6e8ce6-8f40-4868-8a71-c74119f173ea)                      | failing            | n/a | router_z1 | 10.244.0.34  |
| hm9000_z1/0 (ff8ae6a3-1889-4fb0-aabf-072012cf9f48)                        | unresponsive agent | n/a | medium_z1 | 10.244.0.142 |
| loggregator_trafficcontroller_z1/0 (8f2e4ea1-dda7-4d15-9050-528338824e3b) | unresponsive agent | n/a | small_z1  | 10.244.0.150 |
| nats_z1/0 (9e4eab32-ac91-4f05-83be-b8189c2991e7)                          | unresponsive agent | n/a | medium_z1 | 10.244.0.6   |
| postgres_z1/0 (fb8d1eee-3ade-480e-aa01-3db26a64b447)                      | unresponsive agent | n/a | medium_z1 | 10.244.0.30  |
| router_z1/0 (f9ce017b-580f-4fce-b79d-01ceef190e19)                        | unresponsive agent | n/a | router_z1 | 10.244.0.22  |
| runner_z1/0 (c0b0871b-c672-46c8-ac4a-1aabd81864f6)                        | unresponsive agent | n/a | runner_z1 | 10.244.0.26  |
| uaa_z1/0 (63b4bfa7-499d-4dba-93f6-2017b04a7588)                           | unresponsive agent | n/a | medium_z1 | 10.244.0.134 |
+---------------------------------------------------------------------------+--------------------+-----+-----------+--------------+



> bosh cck

Acting as user 'admin' on deployment 'cf-warden' on 'Bosh Lite Director'
Performing cloud check...

Director task 96
Error 100: Unable to get deployment lock, maybe a deployment is in progress. Try again later.

Task 96 error

For a more detailed error report, run: bosh task 96 --debug

> bosh locks

Acting as user 'admin' on 'Bosh Lite Director'

No locks
可以使用下面的命令执行“重置”并使其重新启动和运行,但这需要相当长的时间,而且肯定比需要的更像“锤子”

# bosh-lite dir 
vagrant destroy && vagrant up

# cd cf-release dir 
bosh upload release
bosh deploy 

# cd bosh-lite dir
bin/add-route
cf api --skip-ssl-validation https://api.bosh-lite.com
cf create-org my_org
cf create-space development -o my_org

您可以在使用
vagrant ssh
ssh进入bosh lite VM后使用
sudo su
成为root用户,而无需输入root密码

在VM重新启动/睡眠后,BOSH lite一直很难恢复。
最近有人(2016年12月)编写了一个实用程序“优雅地将运行BOSH Lite的机器置于睡眠状态”,并在系统唤醒时将其恢复,以解决此问题:

我通常先执行
vagrant suspend
,然后执行
vagrant up
,以避免在BOSH Lite中出现容器/虚拟机死机的情况


您可以执行
bosh cck
,但我的经验表明,简单的部署重建速度更快,也更可靠。

建议我们在不使用bosh lite VM时暂停它,以便在系统进入睡眠/重新启动后可以简单地恢复它;否则VM将被OS停止(Bosh lite VM处于中止状态)。在中止的bosh lite上运行
vagrant up
,使其运行,但在这种情况下,CF VM处于无响应状态,需要重新部署


重新启动工作时运行
vagrant suspend
暂停和
vagrant resume
,有助于避免CF VM无响应的情况

似乎在一个新的部署之后,仅仅运行vagrant reload——provision将破坏它。我不能给你一个完整的答案,但是当你重新启动或停止时,那么打开bosh lite VM,任何现有的作业都将丢失。这是因为bosh lite将作业部署到VM上的容器中,而这些容器在重新启动后不会重新启动。最简单的恢复和运行方法通常是
boshcck
。它将检测到容器已关闭,并允许您重新创建它们。锁错误有点令人惊讶。您可以再次运行它,看看是否一直出现锁错误。您也可以尝试禁用resurrector,看看这是否有帮助。有时这会锁定部署。我也在使用
vagrant suspend
但是
vagrant resume
。或者,要修复构建,
bosh cck