Python 张量流向前传播极慢

Python 张量流向前传播极慢,python,tensorflow,deep-learning,Python,Tensorflow,Deep Learning,在使用tensorflow(在两台不同的机器上分别为0.12.1和0.11.0rc1)时,我遇到了一个问题,即手动执行正向传播和梯度计算的速度非常慢(另一方面,训练效果很好) 特别是,调用sess.run(predicts,feed_dict={…}需要1到1.2秒的时间来处理一幅图像。参考一下,caffe中实现的相同体系结构大约需要100-150毫秒,这与我重新实现的论文中报告的时间一致。类似的时间量(~1.5秒)需要通过tf.gradients通过网络进行反向传播。同样,caffe中的相同架

在使用tensorflow(在两台不同的机器上分别为0.12.1和0.11.0rc1)时,我遇到了一个问题,即手动执行正向传播和梯度计算的速度非常慢(另一方面,训练效果很好)

特别是,调用
sess.run(predicts,feed_dict={…}
需要1到1.2秒的时间来处理一幅图像。参考一下,caffe中实现的相同体系结构大约需要100-150毫秒,这与我重新实现的论文中报告的时间一致。类似的时间量(~1.5秒)需要通过
tf.gradients
通过网络进行反向传播。同样,caffe中的相同架构需要大约1/10的时间

我在前进道具期间检查了GPU的使用情况,以确保它实际使用了GPU,并且在
sess.run
(分别在两台机器上使用带有cuda 8的GTX TITAN Z和带有cuda 7.5的TITAN X)

caffe中相同的架构(相当简单的conv-deconv)运行良好,这一事实让我认为我的tensorflow代码或配置中存在错误,但我不知道从何开始。有什么建议吗

谢谢

编辑:添加代码处的链接


Tensorflow网络和前向函数:(忽略前向函数看起来像dcgan的事实,问题仍然存在)


Caffe prototxt和forward函数:

您是否有到源代码的链接您的问题太广泛,添加代码(可能适用于Caffe和tensorflow实现)会使您的问题更容易得到回答。tensorflow网络和forward函数:(忽略forward函数看起来像dcgan的事实)Caffe prototxt和forward函数:源代码似乎已从PasteBind中删除。您是否有指向源代码的链接?您的问题太广泛,添加代码(可能适用于Caffe和tensorflow实现)会使您的问题更容易得到回答。tensorflow网络和forward函数:(忽略forward函数看起来像dcgan的事实)Caffe prototxt和forward函数:源代码似乎已从pastebin中删除