Google cloud ml 使用云tpu无法使用google ai平台train api

Google cloud ml 使用云tpu无法使用google ai平台train api,google-cloud-ml,google-cloud-tpu,tensor2tensor,Google Cloud Ml,Google Cloud Tpu,Tensor2tensor,几天前,我已经成功地将ai平台train api与tensor2tensor和cloud tpu后端结合使用, 但似乎有些事情发生了变化,从上周开始我就无法让它工作了 我在日志中看到的工作/非工作之间的差异是配置中的“\u master”和“\u evaluation\u master” TrainAPI的最后一个成功日志如下所示 Using config: { '_model_dir':..., ...., '_master': 'grpc://10.228.38.186:847

几天前,我已经成功地将ai平台train api与tensor2tensor和cloud tpu后端结合使用, 但似乎有些事情发生了变化,从上周开始我就无法让它工作了

我在日志中看到的工作/非工作之间的差异是配置中的“\u master”和“\u evaluation\u master”

TrainAPI的最后一个成功日志如下所示

Using config: {
  '_model_dir':..., 
  ....,
  '_master': 'grpc://10.228.38.186:8470', 
  '_evaluation_master': 'grpc://10.228.38.186:8470', 
  ...
  '_cluster': None, 'use_tpu': True
}
然而,我从上周开始看到的日志如下

Using config: {
  '_model_dir': ...,
  '_master': 'cmle-training-2190487948974557758-tpu', 
  '_evaluation_master': 'cmle-training-2190487948974557758-tpu', 
  ...,
  '_cluster': None, 'use_tpu': True
} 
然后,tensorflow尝试通过主机名连接tpu,最终失败,进程停止


Not found: No session factory registered for the given session options: 
{
  target: "cmle-training-4208055151697798232-tpu" 
  config: operation_timeout_in_ms: 300000
} 
Registered factories are {DIRECT_SESSION, GRPC_SESSION}.
两个实验使用相同的代码

如果有人遇到过类似的问题,请指导我解决。谢谢