Google colaboratory 机器学习与模型训练

Google colaboratory 机器学习与模型训练,google-colaboratory,Google Colaboratory,我正在从事一个机器学习项目,在那里我正在谷歌Colab上训练我的模型。 我已经克隆了存储库,并使用tensor flow框架构建了模型 但是,我的数据集太大了。在运行模型之前,我想到了两个问题: 1) 如果我一夜之间离开我的模型去接受培训,那么最聪明的方式是什么来知道我的培训已经完成/在两者之间结束?(任何通过电子邮件发出的通知..或?) 2) 如果互联网连接中断,会发生什么情况 我的谷歌搜索没有提供我可以理解的答案。如果您能为我的查询提供解决方案,我将不胜感激。最多可以同时运行两个实例,并链接

我正在从事一个机器学习项目,在那里我正在谷歌Colab上训练我的模型。 我已经克隆了存储库,并使用tensor flow框架构建了模型

但是,我的数据集太大了。在运行模型之前,我想到了两个问题:

1) 如果我一夜之间离开我的模型去接受培训,那么最聪明的方式是什么来知道我的培训已经完成/在两者之间结束?(任何通过电子邮件发出的通知..或?)

2) 如果互联网连接中断,会发生什么情况


我的谷歌搜索没有提供我可以理解的答案。如果您能为我的查询提供解决方案,我将不胜感激。

最多可以同时运行两个实例,并链接到您的Google帐户。继续增加你的体重,如果需要超过12小时,就重新训练

对于这样长的工作,投资VPS总是更好,但要回答你的问题

  • 浏览器打开时,Colab上作业的最长生存期为12小时。因此,定期保存模型权重是一个好主意。训练时备份重量的脚本是个好主意

  • 如果internet连接中断,笔记本将运行90分钟,然后实例将被视为空闲,并将被回收。这类似于关闭浏览器