TensorFlow:嵌入模型不必要地使用了太多的GPU内存

TensorFlow:嵌入模型不必要地使用了太多的GPU内存,tensorflow,Tensorflow,我正在使用TensorFlow中的知识图嵌入,但在扩展时遇到问题: TensorFlow保持每个批次样品相对于所有嵌入物的梯度,即使每个样品仅与三个嵌入物直接相关 理论上,对于每个批次,只需要将与当前样本相关的嵌入梯度带到GPU内存中。这将大大减少内存使用,并增加内存开销 在批处理嵌入时,有没有一种方法可以提高内存效率 我正在使用tf.nn.embedded\u lookup而不进行分区。我尝试过使用tf.fixed\u size\u partitioner进行分区,但内存使用情况类似

我正在使用TensorFlow中的知识图嵌入,但在扩展时遇到问题:

TensorFlow保持每个批次样品相对于所有嵌入物的梯度,即使每个样品仅与三个嵌入物直接相关

理论上,对于每个批次,只需要将与当前样本相关的嵌入梯度带到GPU内存中。这将大大减少内存使用,并增加内存开销

在批处理嵌入时,有没有一种方法可以提高内存效率

我正在使用
tf.nn.embedded\u lookup
而不进行分区。我尝试过使用
tf.fixed\u size\u partitioner进行分区,但内存使用情况类似