&引用;冷冻;使用PostgreSQL的Google计算引擎实例
我们在Google compute engine上使用PostgreSQL运行了几个Debian实例,最近我们已经看到了以下问题的多次出现 实例突然变得没有响应。我们无法对其进行ssh,也无法连接到数据库。在此期间,使用telegraf的内部监测也没有运行,没有收集到监测数据 谷歌对CPU活动的监控显示,在此期间CPU的使用率非常低。GCP日志没有显示任何迁移,事实上根本没有显示任何迁移。此外,所有内部日志(例如postgresql日志、syslog、来自定期cronjobs的日志)都显示相同的间隔。看起来该实例在那段时间内被冻结了。到目前为止,我们只注意到PostgreSQL实例,因为它们被大量使用 实例运行以下OS和PG变体:&引用;冷冻;使用PostgreSQL的Google计算引擎实例,postgresql,google-compute-engine,Postgresql,Google Compute Engine,我们在Google compute engine上使用PostgreSQL运行了几个Debian实例,最近我们已经看到了以下问题的多次出现 实例突然变得没有响应。我们无法对其进行ssh,也无法连接到数据库。在此期间,使用telegraf的内部监测也没有运行,没有收集到监测数据 谷歌对CPU活动的监控显示,在此期间CPU的使用率非常低。GCP日志没有显示任何迁移,事实上根本没有显示任何迁移。此外,所有内部日志(例如postgresql日志、syslog、来自定期cronjobs的日志)都显示相同的
- Debian 9和第11.9页
- Debian 9和第10.13页
更新3:分析数据库今天有几起性质相同的小事件。在最后一次中,我们从GCPGUI停止了实例,并在几分钟后再次启动它。可能是因为迁移到了不同的硬件。由于此操作实例运行正常。我遇到了类似的问题,但在GCP中有一个MySQL实例,第一个问题与我使用的VM实例的类型有关,我在这个VM实例上有一个f1微型机类型,突然我无法访问ssh。由于这种类型的VM实例只有0.6GB的内存,它很快就耗尽了内存,我将其更改为默认值为e2的介质,这一次它解决了我的问题。 由于实例内存不足,实例中的服务开始失败,这就是我无法访问实例的原因 还有一次,我又开始了类似的问题,但这一次,问题是磁盘,我只有10GB,有一个进程填满了我的磁盘,当一个分区空间不足时,实例再次开始失败。 我只调整了我的磁盘大小,现在我的实例磁盘是20GB,工作正常 话虽如此,我建议根据您的便利增加您的资源,以提高您的性能,因为有您描述的问题是一个很好的指标,表明您现有的机器类型不适合您在该实例上运行的工作负载 如果您的情况与我的情况相同,您可以更改机器类型以调整内存,并且您可以按照这些任务的后续步骤进行操作。请访问以下网站以获取更多信息 更改机器类型 1.-去医院 2.-在“名称”列中,单击您的实例
gcloud compute disks resize DISK_NAME --size DISK_SIZE
或使用控制台:
/var/log/kern.log
此外,消息日志也会有所帮助
/var/log/messages
您可以在此中获取有关日志的更多信息
而且,我认为它可以