Python 使用Keras和远程TesorFlow训练模型

Python 使用Keras和远程TesorFlow训练模型,python,tensorflow,keras,remote-server,tf.keras,Python,Tensorflow,Keras,Remote Server,Tf.keras,由于我找不到任何有用的信息,我想请你帮忙 我想在服务器上启动TensorFlow(2.1.0),并在客户机上使用keras在其上训练模型 为了启动TensorFlow服务器,我使用了远程计算机上的类: 将tensorflow导入为tf 集群规格=tf.train.ClusterSpec({ “工人”:[ “远程主机:2222” ], “ps”:[ “远程主机:2221” ] }) ps=tf.distribute.Server(集群规范,作业名称=“ps”,任务索引=0) worker=tf.d

由于我找不到任何有用的信息,我想请你帮忙

我想在服务器上启动TensorFlow(2.1.0),并在客户机上使用keras在其上训练模型

为了启动TensorFlow服务器,我使用了远程计算机上的类:

将tensorflow导入为tf
集群规格=tf.train.ClusterSpec({
“工人”:[
“远程主机:2222”
],
“ps”:[
“远程主机:2221”
]
})
ps=tf.distribute.Server(集群规范,作业名称=“ps”,任务索引=0)
worker=tf.distribute.Server(集群规范,作业名称=“worker”,任务索引=0)
ps.join()
worker.join()
使用此方法,客户端可以成功连接到服务器:

tf.config.experimental\u连接到\u主机(remote\u host='remotehost:2222',job\u name='worker')
但是,我不知道如何告诉keras使用这个服务器。因此,在创建和训练模型之前,我刚刚调用了
experimental\u connect\u to\u host
。连接已建立,但培训仍在本地进行:

2020-09-25 17:42:25.776262:I tensorflow/core/platform/cpu\u feature\u guard.cc:142]您的cpu支持未编译此tensorflow二进制文件以使用的指令:AVX AVX2
2020-09-25 17:42:25.809998:I tensorflow/core/common_runtime/process_util.cc:147]使用默认的操作间设置创建新线程池:2。使用inter_op_parallelism_线程进行优化,以获得最佳性能。
2020-09-25 17:42:25.875051:I tensorflow/core/distributed_runtime/rpc/grpc_channel.cc:300]为作业工人初始化GrpcChannelCache->{0->remotehost:2222}
2020-09-25 17:42:25.889637:I tensorflow/core/distributed_runtime/rpc/grpc_channel.cc:300]为作业localhost初始化GrpcChannelCache->{0->localhost:59320}
2020-09-25 17:42:28.325110:I tensorflow/core/distributed_runtime/rpc/grpc_channel.cc:300]为作业工人初始化GrpcChannelCache->{0->remotehost:2222}
2020-09-25 17:42:28.368530:I tensorflow/core/distributed_runtime/rpc/grpc_channel.cc:300]为作业localhost初始化GrpcChannelCache->{0->localhost:59320}
2020-09-25 17:42:28.427439:I tensorflow/core/distributed_runtime/rpc/grpc_server_lib.cc:390]已启动目标为的服务器:grpc://localhost:59320
培训539个样本,验证29个样本
纪元1/300
539/539-2s-损耗:0.4477-精度:0.8534-瓦尔-损耗:0.4668-瓦尔-精确度:0.8276
...
有人知道是否以及如何使用Keras和TensorFlow在远程设备上进行培训吗

先谢谢你