Python Tensorflow语音识别,运行sess.run失败,返回“0”;无法将字符串转换为float";

Python Tensorflow语音识别,运行sess.run失败,返回“0”;无法将字符串转换为float";,python,tensorflow,speech-recognition,Python,Tensorflow,Speech Recognition,我已根据以下说明培训了一名模特: 我有一个ckpt文件,但无法使用tensorflow的官方指令将其冻结并生成PB 为了创建PB文件,我使用以下转换器转换了pbtxt: 现在,当运行Tensorflow官方“label_wav_文件”时,我发现以下错误: 2018-08-02 10:15:12.263821:I tensorflow/core/platform/cpu\u feature\u guard.cc:140]您的cpu支持 未编译此TensorFlow二进制文件以使用的指令:AVX

我已根据以下说明培训了一名模特:

我有一个ckpt文件,但无法使用tensorflow的官方指令将其冻结并生成PB

为了创建PB文件,我使用以下转换器转换了pbtxt:

现在,当运行Tensorflow官方“label_wav_文件”时,我发现以下错误:

2018-08-02 10:15:12.263821:I tensorflow/core/platform/cpu\u feature\u guard.cc:140]您的cpu支持 未编译此TensorFlow二进制文件以使用的指令:AVX2 FMA回溯(最后一次调用):文件“label_wav.py”,第行 134,在 tf.app.run(main=main,argv=[sys.argv[0]]]+未解析)文件“/usr/local/lib/python3.5/dist-packages/tensorflow/python/platform/app.py”, 第126行,运行中 _sys.exit(main(argv))文件“label_wav.py”,在main中的第106行 FLAGS.output_name,FLAGS.how_numbers_label)文件“label_wav.py”,第100行,在label_wav中 运行图(wav数据、标签列表、输入名称、输出名称、标签数量)文件“label_wav.py”,第68行,在运行图中 预测,=sess.run(softmax\u tensor,{input\u layer\u name:wav\u data})文件 “/usr/local/lib/python3.5/dist-packages/tensorflow/python/client/session.py”, 第900行,运行中 运行元数据文件“/usr/local/lib/python3.5/dist-packages/tensorflow/python/client/session.py”, 1104号线,在运行中 np_val=np.asarray(subfeed_val,dtype=subfeed_dtype)文件“/home/user/.local/lib/python3.5/site packages/numpy/core/numeric.py”, 第531行,在asarray中 返回数组(a,dtype,copy=False,order=order)值错误:无法将字符串转换为浮点:b'RIFF$}\x00\X00MT \x10\x00\x00\x00\x01\x00\x01\x00

我想确定我打算用作输入和输出层的层(我怀疑这是问题的根源)

输入层:数据/Mul:0 输出层:ArgMax:0

(我选择了以下作为输出层,因为它在pbtxt文件中被设置为输出层)

我的图形中存在以下图层:

你知道什么是正确的图层,或者我做错了什么吗?

在你的回溯中:

ValueError:无法将字符串转换为浮点:b'RIFF$}\x00\x00wavemt\x10\x00\x00\x00\x00\x01\x00\x01\x00

您试图向网络提供一个以字节字符串形式读取的文件,这将不起作用。您选择作为输入的层需要某种形状的
浮点
矩阵,这不是您要处理的。
您需要研究网络体系结构,以了解数据是如何传入的,以及为了能够在网络中提供数据,您需要做哪些输入预处理

此时我正在使用默认设置(再次-仅使用TF内置示例):使用open(wav,'rb')作为wav_文件:wav_data=wav_file.read(),“RIFF…”是Wav标题的开头。不过,看看培训脚本,你会发现
Wav_数据在进入你选择作为输入的层之前发生了很多转换。你需要准确地复制这些转换。我认为官方示例将开箱即用(你能告诉我它在哪里吗?因为我在train.py itslef中没有看到任何关于它的信息,test_label_wav.py包含以下内容:“contrib_audio.encode_wav(sample_data,16000)”,添加它会给我相同的错误信息