Tensorflow 使用笔记本连接到google cloud TPU的连接超时
我正在尝试用伯特训练一个模型。对于伯特参数,我希望能够使用我自己的数据集对参数进行微调 我正在使用谷歌云平台和TPU加速培训过程 我在下面的教程中刚刚替换了以下几行: 取代:Tensorflow 使用笔记本连接到google cloud TPU的连接超时,tensorflow,google-cloud-platform,google-colaboratory,google-cloud-tpu,tpu,Tensorflow,Google Cloud Platform,Google Colaboratory,Google Cloud Tpu,Tpu,我正在尝试用伯特训练一个模型。对于伯特参数,我希望能够使用我自己的数据集对参数进行微调 我正在使用谷歌云平台和TPU加速培训过程 我在下面的教程中刚刚替换了以下几行: 取代: tf.estimator.Estimator( model_fn=model_fn_par, config=run_config_par, params={"batch_size": BATCH_SIZE}) 与: 取代: run_config_par = tf.estimator.RunConfig( model_di
tf.estimator.Estimator(
model_fn=model_fn_par,
config=run_config_par,
params={"batch_size": BATCH_SIZE})
与:
取代:
run_config_par = tf.estimator.RunConfig(
model_dir=OUTPUT_DIR,
save_summary_steps=SAVE_SUMMARY_STEPS,
save_checkpoints_steps=SAVE_CHECKPOINTS_STEPS)
与:
并定义了以下参数:
my_project = MY_PROJECT_NAME
my_zone = 'us-central1-b'
cluster_resolver = tf.contrib.cluster_resolver.TPUClusterResolver(
tpu=[MY_TPU_NAME],
zone=my_zone,
project=my_project)
master = cluster_resolver.get_master()
运行以下行时:
estimator_par.train(input_fn=train_input_fn_par, max_steps=num_train_steps)
笔记本电脑尝试连接到以下地址120次,但未成功,并返回超时错误:
Querying Tensorflow master (grpc://10.240.1.2:8470) for TPU system metadata.
我已经创建并实例化了if-TPU,并将笔记本运行时类型也设置为TPU。
有人知道为什么我不能用笔记本连接到TPU吗 您是从编辑>笔记本设置>硬件加速器中选择TPU的吗?您是从编辑>笔记本设置>硬件加速器中选择TPU的吗?@AlexIlchenko Oh我已被选中,但很明显,由于重新启动,TPU已被更改。我又选了一次,问题就解决了。谢谢,让我们把它变成一个你可以接受的答案。
estimator_par.train(input_fn=train_input_fn_par, max_steps=num_train_steps)
Querying Tensorflow master (grpc://10.240.1.2:8470) for TPU system metadata.