Python 你能在Pocketsphinx中对多个文件使用相同的解码器吗?

Python 你能在Pocketsphinx中对多个文件使用相同的解码器吗?,python,pocketsphinx,Python,Pocketsphinx,Pocketsphinx(Python)中的多个wav文件是否可以使用相同的解码器?我有下面的代码片段,这是非常标准的,只是我在同一个文件上调用了解码器两次。但是,输出不一样。我还尝试过在不同的文件上使用解码器两次,根据调用文件的顺序,输出是不同的-第一个文件正确解码,但第二个文件没有正确解码。此外,只有当第一个文件有一些输出时才会发生这种情况——如果第一个文件没有任何单词,那么第二个文件就可以解码。这使我相信解码器在解码一个文件后会以某种方式进行修改。我说的对吗?有没有办法重置解码器,或者通常

Pocketsphinx(Python)中的多个wav文件是否可以使用相同的解码器?我有下面的代码片段,这是非常标准的,只是我在同一个文件上调用了解码器两次。但是,输出不一样。我还尝试过在不同的文件上使用解码器两次,根据调用文件的顺序,输出是不同的-第一个文件正确解码,但第二个文件没有正确解码。此外,只有当第一个文件有一些输出时才会发生这种情况——如果第一个文件没有任何单词,那么第二个文件就可以解码。这使我相信解码器在解码一个文件后会以某种方式进行修改。我说的对吗?有没有办法重置解码器,或者通常使其适用于多个文件?似乎这里应该给出一个例子:

编辑-更多信息:

如果arctic_a0001.wav为,则arctic_a0002.wav为,字典为单行:

of AH V
那么电流输出是:

arctic1: [('<s>', 1), ('of', 1), ('of', -12001), ('<sil>', 0), ('of', -16211), ('<sil>', -1205), ('of', -13991), ('of', 0), ('<sil>', 0), ('of', -31232), ('</s>', 0)]
arctic2: [('<s>', -3), ('[SPEECH]', -725), ('<sil>', -1), ('[SPEECH]', -6), ('<sil>', -20), ('of', -6162), ('[SPEECH]', -397), ('</s>', 0)]
arctic1:[('of',1),('of',1),('of',12001),('of',0),('of',16211),('of',1205),('of',13991),('of',0),('of',0),('of',31232),('of',0)]
arctic2:[('.-3),('.[SPEECH]',-725),('.-1),('.[SPEECH]',-6),('.-20),('of',-6162),('.[SPEECH]',-397),('.-0)]
但如果我们切换它们,输出就会变为

arctic2: [('<s>', 0), ('of', 0), ('<sil>', 0), ('of', -29945), ('<sil>', -20), ('of', -26004), ('of', 0), ('of', 0), ('<sil>', 0), ('of', -84868), ('of', -35690), ('</s>', 0)]
arctic1: [('<s>', -3), ('of', -14886), ('of', -30237), ('<sil>', 0), ('of', -22103), ('of', 1), ('<sil>', 0), ('of', -30795), ('of', -65040), ('</s>', 0)]
arctic2:[('of',0),('of',0),('of',0),('of',0),('of',0),('of',0),('of',0),('of',0),('of',84868),('of',35690),('of',0)]
arctic1:[(''-3),('of',-14886),('of',-30237),('-0),('of',-22103),('of',1),('-0),('of',-30795),('of',-65040),('-0)]
因此,arctic1和arctic2的输出取决于顺序。此外,如果我们使用arctic1两次,输出是

[('<s>', 1), ('of', 1), ('of', -12001), ('<sil>', 0), ('of', -16211), ('<sil>', -1205), ('of', -13991), ('of', 0), ('<sil>', 0), ('of', -31232), ('</s>', 0)]
[('<s>', 1), ('of', -24424), ('of', -24554), ('<sil>', 2), ('[SPEECH]', -37257), ('of', -37008), ('<sil>', -461), ('of', -20422), ('of', 0), ('<sil>', 0), ('of', -3570), ('[SPEECH]', -42), ('</s>', 0)]
[('',1),('of',1),('of',-12001),('',0),('of',-16211),('',-1205),('of',-13991),('of',0),('',0),('of',-31232),('',0)]
[('',1),('',of',24424),('',of',24554),('',2),(''[演讲],-37257),('',of',-37008),('',-461),(''of',20422),('of',0),('',0),('of',-3570),(''[演讲],-42),('',0)
可能是因为我没有使用start_stream()?我不知道该如何使用它。即使我使用decoder.start_stream()(就在decoder.start_utt()之前),输出也是不同的——它变成

[('<s>', 1), ('of', 1), ('of', -12001), ('<sil>', 0), ('of', -16211), ('<sil>', -1205), ('of', -13991), ('of', 0), ('<sil>', 0), ('of', -31232), ('</s>', 0)]
[('<s>', -2), ('of', -33113), ('of', -29715), ('<sil>', 1), ('[SPEECH]', -37258), ('of', -37009), ('<sil>', -461), ('of', -20422), ('of', 0), ('<sil>', 0), ('of', -3570), ('[SPEECH]', -42), ('</s>', 0)]
[('',1),('of',1),('of',-12001),('',0),('of',-16211),('',-1205),('of',-13991),('of',0),('',0),('of',-31232),('',0)]
[2]、[2]、[of]、-33113]、[of]、-29715]、[1]、[SPEECH]、-37258]、[of]、-37009]、[461]、[of]、-20422]、[of]、[0]、[of]、-3570]、[SPEECH]、-42]、[0]、[
如果您想要整个日志,这里()是arctic1在arctic2之前的日志,这里()是arctic2在arctic1之前的日志,而这里是arctic1在一行中两次使用start\u stream()的日志,这里是arctic1在一行中两次使用start\u stream()的日志

Pocketsphinx(Python)中的多个wav文件是否可以使用相同的解码器

我有下面的代码片段,这是非常标准的,只是我在同一个文件上调用了解码器两次。但是,输出不一样

您需要为第二个文件调用
解码器.start_stream()
,以重置解码器计时

我还尝试过在不同的文件上使用解码器两次,根据调用文件的顺序,输出是不同的-第一个文件正确解码,但第二个文件没有正确解码。此外,只有当第一个文件有一些输出时才会发生这种情况——如果第一个文件没有任何单词,那么第二个文件就可以解码


嗯,可能会有不同的事情影响结果。没有榜样很难说。您最好提供示例文件和有问题的输出,以获得此问题的答案。

您好,我要到星期一才能回复此问题,因为我的文件正在工作中,但我只想感谢您快速回复!我编辑了父贴子以包含示例文件和输出!如果您还需要什么,请告诉我。我在日志中没有发现任何错误。结果可能略有不同,因为解码器保持内部状态(CMN值),您可以在日志中看到它。第三次迭代应该和第二次相同。谢谢,有没有办法不保持内部状态/使其保持静态?还没有办法
[('<s>', 1), ('of', 1), ('of', -12001), ('<sil>', 0), ('of', -16211), ('<sil>', -1205), ('of', -13991), ('of', 0), ('<sil>', 0), ('of', -31232), ('</s>', 0)]
[('<s>', -2), ('of', -33113), ('of', -29715), ('<sil>', 1), ('[SPEECH]', -37258), ('of', -37009), ('<sil>', -461), ('of', -20422), ('of', 0), ('<sil>', 0), ('of', -3570), ('[SPEECH]', -42), ('</s>', 0)]