如何在GKE上运行分布式Tensorflow?

如何在GKE上运行分布式Tensorflow?,tensorflow,Tensorflow,我想在GKE上运行分布式Tensorflow。 您需要一个来自GKE设置的分布式TensorFlow的最新运行示例。 您知道一个很好的示例吗?最近在OSCON和PyCon举办的研讨会()讨论了(除其他外)在Kubernetes上运行分布式TensorFlow。有一个包含必要的配置脚本和一个可用于与集群交互的Jupyter笔记本 有关更多详细信息,请参见研讨会,但其基本思想是主服务器、每个辅助服务器和每个参数服务器在大小为1的单独Kubernetes复制控制器中运行。Kubernetes为每个进程

我想在GKE上运行分布式Tensorflow。 您需要一个来自GKE设置的分布式TensorFlow的最新运行示例。 您知道一个很好的示例吗?

最近在OSCON和PyCon举办的研讨会()讨论了(除其他外)在Kubernetes上运行分布式TensorFlow。有一个包含必要的配置脚本和一个可用于与集群交互的Jupyter笔记本

有关更多详细信息,请参见研讨会,但其基本思想是主服务器、每个辅助服务器和每个参数服务器在大小为1的单独Kubernetes复制控制器中运行。Kubernetes为每个进程提供了稳定的名称,您可以使用这些名称构建
tf.train.ClusterSpec
,并将不同的进程互连


设置集群还有其他方法,需要更多配置,但本教程很好地介绍了如何在word2vec模型上设置同步培训。

如果您想在谷歌的云平台上运行TensorFlow,一个选项是