Python tf.估计量:分布式评估

Python tf.估计量:分布式评估,python,tensorflow,distributed,Python,Tensorflow,Distributed,我有一个TensorFlow集群,可以对我的模型进行分布式训练。 我使用配置的TF\u CONFIG环境变量实现了它 虽然我可以使用evaluator任务在任意机器上进行评估,但评估仍然只在机器上进行。 因此,我的训练速度非常快,因为它是在几台机器上进行的,而评估却落后了 培训完成后,是否有可能在多台机器上分发评估 非常感谢您的回答。我遇到了同样的问题,您有什么新的更新吗?谢谢你,我可以使用evaluator任务将评估放在任意机器上,你怎么能这样做?有什么例子吗?我的想法是将index=0和jo

我有一个TensorFlow集群,可以对我的模型进行分布式训练。 我使用配置的
TF\u CONFIG
环境变量实现了它

虽然我可以使用
evaluator
任务在任意机器上进行评估,但评估仍然只在机器上进行。 因此,我的训练速度非常快,因为它是在几台机器上进行的,而评估却落后了

培训完成后,是否有可能在多台机器上分发评估


非常感谢您的回答。

我遇到了同样的问题,您有什么新的更新吗?谢谢你,
我可以使用evaluator任务将评估放在任意机器上
,你怎么能这样做?有什么例子吗?我的想法是将index=0和jobname=worker设置为主管,将index=1设置为评估者,我是否应该为其他员工更新索引?其他工人将指数更新为指数-2,我说的对吗?您好,您是否阅读了
tf.estimator.train\u和\u evaluate
的文档?所有索引都应从零开始。因此,主管显然有
“索引”:0
,工人也从索引0开始。但是,请记住,主管也是一名工人。所以,如果你有一个酋长和两个工人,那么你总共有三个工人。这对于您的输入管道尤其重要。如果使用,则必须将所有工人指数(而非主要指数)增加1。否则,首席工作人员和第一个正常工作人员使用相同的数据。是的,它现在可以工作了,谢谢