Speech recognition Sphinx4音素切分

Speech recognition Sphinx4音素切分,speech-recognition,voice-recognition,cmusphinx,sphinx4,Speech Recognition,Voice Recognition,Cmusphinx,Sphinx4,我正在开发一个系统,我需要一个单词或句子中每个音素的起始帧、结束帧和分段分数。我一直在使用Sphinx-3命令:sphinx3_align,以获得以下结果(示例): 问题是,我必须多次运行此命令,这会消耗服务器中的大量内存。我尝试在一个控制文件中传递许多输入,但这需要大量的时间来处理,并且我的应用程序不能有很高的响应时间 因此,为了节省内存来维持响应时间,我尝试在Sphinx-4中实现相同的系统。这样,我就可以在对齐后立即返回结果,而不必每次运行应用程序时都卸载它 我的疑问是,在当前状态下,Sp

我正在开发一个系统,我需要一个单词或句子中每个音素的起始帧、结束帧和分段分数。我一直在使用Sphinx-3命令:sphinx3_align,以获得以下结果(示例):

问题是,我必须多次运行此命令,这会消耗服务器中的大量内存。我尝试在一个控制文件中传递许多输入,但这需要大量的时间来处理,并且我的应用程序不能有很高的响应时间

因此,为了节省内存来维持响应时间,我尝试在Sphinx-4中实现相同的系统。这样,我就可以在对齐后立即返回结果,而不必每次运行应用程序时都卸载它


我的疑问是,在当前状态下,Sphinx-4中是否可能有上述输出(类似于sphinx3_align),这是不可能的。此功能未实现

     SFrm  EFrm   SegAScr Phone
        0    21    -67327 SIL
       22    37   -236740 AH SIL K b
       38    41    -61028 K AH S i
       42    56    -82368 S K EH i
       57    67   -106366 EH S P i
       68    86   -101908 P EH T i
       87   106    -89226 T P SIL e
      107   113    -82281 SIL
 Total score:     -827244