Google cloud platform GCloud AI Notebook高效实例VM重新启动,恕不另行通知

Google cloud platform GCloud AI Notebook高效实例VM重新启动,恕不另行通知,google-cloud-platform,jupyter-notebook,gcp-ai-platform-notebook,Google Cloud Platform,Jupyter Notebook,Gcp Ai Platform Notebook,我每天都在使用AI平台Python3 Jupyter笔记本电脑,我注意到不同VM类型之间在内存错误情况下存在不一致的行为 假设我试图使用比可用内存更多的内存,而在“标准”VM类型上,我会得到一个“内存错误”堆栈跟踪作为单元输出,在新的“高效实例”类型VM上,内核将自动重新启动,而无需任何通知(甚至单元仍将标记为仍在执行);找出发生了什么的唯一方法是查看htopcore/mem的使用情况 我花了一些时间才意识到发生了什么,我认为输出错误应该是这种情况下的理想响应(与“高效实例”情况不同) 下面是一

我每天都在使用AI平台Python3 Jupyter笔记本电脑,我注意到不同VM类型之间在内存错误情况下存在不一致的行为

假设我试图使用比可用内存更多的内存,而在“标准”VM类型上,我会得到一个“内存错误”堆栈跟踪作为单元输出,在新的“高效实例”类型VM上,内核将自动重新启动,而无需任何通知(甚至单元仍将标记为仍在执行);找出发生了什么的唯一方法是查看
htop
core/mem的使用情况

我花了一些时间才意识到发生了什么,我认为输出错误应该是这种情况下的理想响应(与“高效实例”情况不同)

下面是一个例子来澄清我所描述的内容:

VM常规配置:

  • 环境:英特尔®优化基础(使用英特尔®MKL)
  • 其他配置:默认值
要执行的Python3笔记本单元代码:

import numpy as np
np.random.rand(1000000000,10)
虚拟机类型/输出:

  • e2-highmem-2(2个VCPU,16 GB内存)-->内核重启无通知/日志记录(下面是IMG1)
  • n1-highmem-2(2个VCPU,13 GB内存)-->内存错误回溯为单元输出(下面是IMG2)
  • n2d-highmem-2(2个VCPU,16 GB内存)-->内存错误回溯为单元输出(IMG2如下)
  • IMG1(尽管内核已经重新启动,但没有通知)

    IMG2(内存错误回溯单元输出)

    谢谢您的报道,我会看一下,然后再给您回复。这可能类似于。我会更改该设置,看看这是否有帮助。@Iqrz对此有任何更新。在这个问题上你还需要帮助吗?谢谢你的报道,我会看一看然后再给你回复。这可能类似于。我会更改该设置,看看这是否有帮助。@Iqrz对此有任何更新。在这个问题上你还需要帮助吗?