在GitHub中存储Jupyter文件,但在Docker中运行和编辑的最佳数据科学工作流

在GitHub中存储Jupyter文件,但在Docker中运行和编辑的最佳数据科学工作流,git,docker,github,jupyter-notebook,data-science,Git,Docker,Github,Jupyter Notebook,Data Science,我正在写一个模型分析笔记本,它将在模型培训后自动运行,以存储各种图形和度量。模型使用Docker容器进行训练和托管,因此我在Docker容器的本地实例中运行笔记本,并将其转发到我的浏览器。在Docker容器之外复制Docker文件系统设置是很困难的,因此在Docker容器之外的任何地方运行Jupyter笔记本都是一项挑战 然而,这意味着我正在编辑Docker容器中的Jupyter笔记本,而不是本地计算机中的git跟踪笔记本文件。如果我编辑Docker Jupyter,但未能将其下载到本地计算机并

我正在写一个模型分析笔记本,它将在模型培训后自动运行,以存储各种图形和度量。模型使用Docker容器进行训练和托管,因此我在Docker容器的本地实例中运行笔记本,并将其转发到我的浏览器。在Docker容器之外复制Docker文件系统设置是很困难的,因此在Docker容器之外的任何地方运行Jupyter笔记本都是一项挑战

然而,这意味着我正在编辑Docker容器中的Jupyter笔记本,而不是本地计算机中的git跟踪笔记本文件。如果我编辑Docker Jupyter,但未能将其下载到本地计算机并替换过时的本地版本,那么在下次使用本地文件调用Docker build时,我的所有更改都将被覆盖。到目前为止,这种情况还没有发生,但无论如何,这种工作流程似乎都不是最优的。有人知道更好的方法来进行这种开发吗


如果我在这种情况下做了很多错事,那么我也想听听。谢谢大家!

所以我确实做错了事情。当我将图像推送到AWS上使用时,我的源文件被复制到容器中。但是,对于开发,我可以简单地用本地计算机上的实际文件替换源文件,方法是将源目录装载到源文件最初复制到的目录中。这样,当我编辑Jupyter笔记本时,它是我正在编辑的实际Jupyter笔记本,而不是它的副本