Python Tensorflow语音识别，运行sess.run失败，返回“0”；无法将字符串转换为float"；_Python_Tensorflow_Speech Recognition

Python Tensorflow语音识别，运行sess.run失败，返回“0”；无法将字符串转换为float"；

python tensorflow speech-recognition

Python Tensorflow语音识别，运行sess.run失败，返回“0”；无法将字符串转换为float"；,python,tensorflow,speech-recognition,Python,Tensorflow,Speech Recognition,我已根据以下说明培训了一名模特：我有一个ckpt文件，但无法使用tensorflow的官方指令将其冻结并生成PB 为了创建PB文件，我使用以下转换器转换了pbtxt：现在，当运行Tensorflow官方“label_wav_文件”时，我发现以下错误： 2018-08-02 10:15:12.263821:I tensorflow/core/platform/cpu\u feature\u guard.cc:140]您的cpu支持未编译此TensorFlow二进制文件以使用的指令：AVX

我已根据以下说明培训了一名模特：

我有一个ckpt文件，但无法使用tensorflow的官方指令将其冻结并生成PB

为了创建PB文件，我使用以下转换器转换了pbtxt：

现在，当运行Tensorflow官方“label_wav_文件”时，我发现以下错误：

2018-08-02 10:15:12.263821:I tensorflow/core/platform/cpu\u feature\u guard.cc:140]您的cpu支持未编译此TensorFlow二进制文件以使用的指令：AVX2 FMA回溯（最后一次调用）：文件“label_wav.py”，第行 134，在 tf.app.run（main=main，argv=[sys.argv[0]]]+未解析）文件“/usr/local/lib/python3.5/dist-packages/tensorflow/python/platform/app.py”，第126行，运行中 _sys.exit（main（argv））文件“label_wav.py”，在main中的第106行 FLAGS.output_name，FLAGS.how_numbers_label）文件“label_wav.py”，第100行，在label_wav中运行图（wav数据、标签列表、输入名称、输出名称、标签数量）文件“label_wav.py”，第68行，在运行图中预测，=sess.run（softmax\u tensor，{input\u layer\u name:wav\u data}）文件 “/usr/local/lib/python3.5/dist-packages/tensorflow/python/client/session.py”，第900行，运行中运行元数据文件“/usr/local/lib/python3.5/dist-packages/tensorflow/python/client/session.py”， 1104号线，在运行中 np_val=np.asarray（subfeed_val，dtype=subfeed_dtype）文件“/home/user/.local/lib/python3.5/site packages/numpy/core/numeric.py”，第531行，在asarray中返回数组（a，dtype，copy=False，order=order）值错误：无法将字符串转换为浮点：b'RIFF$}\x00\X00MT \x10\x00\x00\x00\x01\x00\x01\x00

我想确定我打算用作输入和输出层的层（我怀疑这是问题的根源）

输入层：数据/Mul:0 输出层：ArgMax:0

（我选择了以下作为输出层，因为它在pbtxt文件中被设置为输出层）

我的图形中存在以下图层：

你知道什么是正确的图层，或者我做错了什么吗？

在你的回溯中：

ValueError:无法将字符串转换为浮点：b'RIFF$}\x00\x00wavemt\x10\x00\x00\x00\x00\x01\x00\x01\x00

您试图向网络提供一个以字节字符串形式读取的文件，这将不起作用。您选择作为输入的层需要某种形状的

浮点

矩阵，这不是您要处理的。

您需要研究网络体系结构，以了解数据是如何传入的，以及为了能够在网络中提供数据，您需要做哪些输入预处理

此时我正在使用默认设置（再次-仅使用TF内置示例）：使用open（wav，'rb'）作为wav_文件：wav_data=wav_file.read（），“RIFF…”是Wav标题的开头。不过，看看培训脚本，你会发现

Wav_数据在进入你选择作为输入的层之前发生了很多转换。你需要准确地复制这些转换。我认为官方示例将开箱即用（你能告诉我它在哪里吗？因为我在train.py itslef中没有看到任何关于它的信息，test_label_wav.py包含以下内容：“contrib_audio.encode_wav（sample_data，16000）”，添加它会给我相同的错误信息