Python tf.估计量：分布式评估_Python_Tensorflow_Distributed

Python tf.估计量：分布式评估

python tensorflow

Python tf.估计量：分布式评估,python,tensorflow,distributed,Python,Tensorflow,Distributed,我有一个TensorFlow集群，可以对我的模型进行分布式训练。我使用配置的TF\u CONFIG环境变量实现了它虽然我可以使用evaluator任务在任意机器上进行评估，但评估仍然只在机器上进行。因此，我的训练速度非常快，因为它是在几台机器上进行的，而评估却落后了培训完成后，是否有可能在多台机器上分发评估非常感谢您的回答。我遇到了同样的问题，您有什么新的更新吗？谢谢你，我可以使用evaluator任务将评估放在任意机器上，你怎么能这样做？有什么例子吗？我的想法是将index=0和jo

我有一个TensorFlow集群，可以对我的模型进行分布式训练。我使用配置的

TF\u CONFIG

环境变量实现了它

虽然我可以使用

evaluator

任务在任意机器上进行评估，但评估仍然只在机器上进行。因此，我的训练速度非常快，因为它是在几台机器上进行的，而评估却落后了

培训完成后，是否有可能在多台机器上分发评估

非常感谢您的回答。

我遇到了同样的问题，您有什么新的更新吗？谢谢你，

我可以使用evaluator任务将评估放在任意机器上

，你怎么能这样做？有什么例子吗？我的想法是将index=0和jobname=worker设置为主管，将index=1设置为评估者，我是否应该为其他员工更新索引？其他工人将指数更新为指数-2，我说的对吗？您好，您是否阅读了

tf.estimator.train\u和\u evaluate

的文档？所有索引都应从零开始。因此，主管显然有

“索引”：0

，工人也从索引0开始。但是，请记住，主管也是一名工人。所以，如果你有一个酋长和两个工人，那么你总共有三个工人。这对于您的输入管道尤其重要。如果使用，则必须将所有工人指数（而非主要指数）增加1。否则，首席工作人员和第一个正常工作人员使用相同的数据。是的，它现在可以工作了，谢谢