Google cloud platform Datalab-如何安装和保存软件包

Google cloud platform Datalab-如何安装和保存软件包,google-cloud-platform,google-cloud-datalab,Google Cloud Platform,Google Cloud Datalab,我决定尝试将Google Cloud Datalab用于我正在进行的一个小项目,而不是在AWS实例的Anaconda环境中使用Jupyter笔记本 如何将软件包(例如OpenCV)安装到Datalab VM上,以便不必在每次重新启动VM时重新安装它?为什么每次重启后软件包都会消失,但更新后的笔记本电脑会保持不变?回答这些问题并澄清Datalab VM如何工作的任何帮助都将非常有用。笔记本电脑存储在docker卷挂载中,该挂载表示在VM重启期间维护的永久磁盘上的一个位置 但是,您安装的软件包存储在

我决定尝试将Google Cloud Datalab用于我正在进行的一个小项目,而不是在AWS实例的Anaconda环境中使用Jupyter笔记本


如何将软件包(例如OpenCV)安装到Datalab VM上,以便不必在每次重新启动VM时重新安装它?为什么每次重启后软件包都会消失,但更新后的笔记本电脑会保持不变?回答这些问题并澄清Datalab VM如何工作的任何帮助都将非常有用。

笔记本电脑存储在docker卷挂载中,该挂载表示在VM重启期间维护的永久磁盘上的一个位置

但是,您安装的软件包存储在正在运行的容器中,因此每次重新启动时都会丢失

您可以创建一个自定义docker映像并使用它。在
datalab create
命令上,请参见
--image name
参数

下面是您要使用的Dockerfile示例:

FROM gcr.io/cloud-datalab/datalab:latest
RUN pip install opencv
请注意,您需要使用此docker文件构建docker映像,并将映像推送到Google容器注册表。我的记忆有点模糊,但这张图片可能需要标记为公共


希望有帮助

谢谢你,尼基!话虽如此,我还是很难看出使用Datalab的优势,而不仅仅是在计算引擎VM上安装Conda并在那里运行Jupyter笔记本电脑。这样我就可以轻松地安装新的软件包,并让它们持久地留在实例上。我仍然不明白为什么我要在这种情况下使用Datalab?我阅读了文档,但这还不清楚。@haroon7我可以想到两个好处:一个是与git回购的集成,允许同事之间共享工作;另一方面,与部署新VM、安装python、配置开发环境等相比,更改后端更容易。