Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/oop/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何使用tensorflow复制经过训练的模型?_Python_Oop_Tensorflow - Fatal编程技术网

Python 如何使用tensorflow复制经过训练的模型?

Python 如何使用tensorflow复制经过训练的模型?,python,oop,tensorflow,Python,Oop,Tensorflow,我有一个课程,有一个模型规范和一些方法来训练和评估模型。我想复制一个经过训练的对象,我尝试了copy.deepcopy(),但没有成功 下面的代码只是一个示例,但我希望它适用于使用以下相同思想的任何模型: from __future__ import absolute_import from __future__ import division from __future__ import print_function import argparse import sys import copy

我有一个课程,有一个模型规范和一些方法来训练和评估模型。我想复制一个经过训练的对象,我尝试了
copy.deepcopy()
,但没有成功

下面的代码只是一个示例,但我希望它适用于使用以下相同思想的任何模型:

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function
import argparse
import sys
import copy
from tensorflow.examples.tutorials.mnist import input_data
import tensorflow as tf
FLAGS = None

class Model():

    def __init__(self):
        self.x = tf.placeholder(tf.float32, [None, 784])
        self.W = tf.Variable(tf.zeros([784, 10]))
        self.b = tf.Variable(tf.zeros([10]))
        self.y = tf.matmul(self.x, self.W) + self.b
        self.y_ = tf.placeholder(tf.float32, [None, 10])
        self.cross_entropy = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=self.y_, logits=self.y))
        self.train_step = tf.train.GradientDescentOptimizer(0.5).minimize(self.cross_entropy)

    def train(self, mnist, sess):
        for _ in range(1000):
            batch_xs, batch_ys = mnist.train.next_batch(100)
            sess.run(self.train_step, feed_dict={self.x: batch_xs, self.y_: batch_ys})

    def test(self, mnist, sess):
        self.correct_prediction = tf.equal(tf.argmax(self.y, 1), tf.argmax(self.y_, 1))
        self.accuracy = tf.reduce_mean(tf.cast(self.correct_prediction, tf.float32))
        print(sess.run(self.accuracy, feed_dict={self.x: mnist.test.images, self.y_: mnist.test.labels}))

def main(_):
    # Import data
    mnist = input_data.read_data_sets(FLAGS.data_dir, one_hot=True)
    m = Model()
    sess = tf.InteractiveSession()
    tf.global_variables_initializer().run()
    m.train(mnist, sess)
    copy_of_m = copy.deepcopy(m)  # DOES NOT WORK !
    m.test(mnist, sess)
    copy_of_m.test(mnist, sess)

if __name__ == '__main__':
    parser = argparse.ArgumentParser()
    parser.add_argument('--data_dir', type=str, default='/tmp/tensorflow/mnist/input_data', help='Directory for storing input data')
    FLAGS, unparsed = parser.parse_known_args()
    tf.app.run(main=main, argv=[sys.argv[0]] + unparsed)
在这个线程中,您可以使用
从复制导入复制
并执行
复制(模型)
而不是深度复制


您还可以使用
tf.keras.models.clone\u model
并将另一个模型的权重加载到您的复制模型中。

,如de1在注释中所述


TensorFlow变量存在于图形中,不能单独序列化/去序列化

您不能使用
deepcopy
简单地复制
tensorflow
模型,因为
变量
位于图形内部。尽管
变量本身无法复制(如果复制它们,您将收到此异常
类型错误:无法pickle\u thread.RLock对象
),您可以使用
来复制它们的值。比如说,

tf.reset_default_graph()

class Model():

    def __init__(self):
        
        self.normal = 2
        self.x = tf.ones([1,2])
        self.W = tf.Variable(tf.zeros([2, 2]))
        self.b = tf.Variable(tf.zeros([2]))
        self.y = tf.matmul(self.x, self.W) + self.b
        self.train_step = tf.train.GradientDescentOptimizer(0.5).minimize(self.y)
        self.inside_tf = ['W','b','x','y','train_step']
        
    def __getstate__(self):
        
        for item in self.inside_tf:
            setattr(self,'%s_val' % item,sess.run(getattr(self,item))) 
        state = self.__dict__.copy()
        for item in self.inside_tf:
            del state[item]
        return state

    def __setstate__(self, state):
        
        self.__dict__.update(state)

# Import data
m = Model()
sess = tf.InteractiveSession()
tf.global_variables_initializer().run()

copy_of_m = copy.deepcopy(m)
通过运行此脚本可以看到,在酸洗(复制之前)之前,在
\uuuu getstate\uuuu
方法中,我们首先保存
变量
s的值,然后从
self.\uu dict\uuu
的副本中删除它们。因此,在酸洗(复制)时,只会酸洗
变量
s的值


通过运行
[item for item in dir(copy_of_m)if item[:2]!=''u_']
,您可以看到对象
copy_of_m
具有属性
[W_val',b_val',inside_tf',normal'train_step_val',x_val',y_val']
。虽然像
W_val
这样的属性不是
tensorflow
变量
s,但是很明显,
变量
s的值对我们来说是最重要的。

你试过tf.identity(m)吗?tensorflow变量存在于一个图中,不能单独序列化/去序列化。看见