Nlp 如何计算音频文件中的语音音节数？_Nlp_Speech Recognition

Nlp 如何计算音频文件中的语音音节数？

nlp speech-recognition

Nlp 如何计算音频文件中的语音音节数？,nlp,speech-recognition,Nlp,Speech Recognition,我有许多干净的音频文件，只有普通话语音。我需要估计每个文件中有多少音节。是否有一个适用于OSX、Windows或Linux的工具可以评估这些问题 sample01.wav 15 sample02.wav 8 sample03.wav 5 sample04.wav 1 sample05.wav 18 由于文件较多，建议使用命令行或批处理软件，例如： $ application sample01.wav 15 使用语音转换为文本，然后统计出现的字符数的解决方案适用于您可以使用共振峰来确定这一

我有许多干净的音频文件，只有普通话语音。我需要估计每个文件中有多少音节。是否有一个适用于OSX、Windows或Linux的工具可以评估这些问题

sample01.wav 15
sample02.wav 8
sample03.wav 5
sample04.wav 1
sample05.wav 18

由于文件较多，建议使用命令行或批处理软件，例如：

$ application sample01.wav
15

使用语音转换为文本，然后统计出现的字符数的解决方案适用于

您可以使用共振峰来确定这一点。每个音节都应该对应一个共振峰。以下是关于共振峰的更多信息：

语音自动分割是一个活跃的科学领域，这意味着没有一种方法可以完美地工作

2009年，de Jong和Wempe提出了一种方法，通过使用语音信号自动检测人类语音信号中的音节。该方法与人工分割方法相比效果良好，并已在许多第三方科学研究中得到应用。您可以在他们的科学文章（）中找到该方法的详细描述，以及对以前提出的方法的历史观点。Praat脚本本身和一些教程可以在专门的网站（）上找到

您可能还对由开发的另一个分割算法感兴趣，该算法已在Matlab（）中实现。

这可能会让您感兴趣

您的问题需要特别注意，并针对语音到文本的转换提出解决方案。我真的怀疑任何免费的开源库，容易获得和服务的目的将得到满足

我使用了一个，但目的相反“文本到语音”。虽然这不是一个免费的图书馆，但我很乐意帮助谷歌“annosoft lipsync”

该库也可用于SDK评估……

我只是想知道如何奖励一个答案（来自@navneet3571）而这个答案位于我的后面，并且只包含我在答案中给出的一个链接。看起来不公平不？对不起，我搞错了。我知道演讲稿解决了这个问题，但我没有意识到它在两篇不同的帖子中被提及。当我有更多的分数时，我会找到一些方法来奖励你赏金分数。那很好，我可以让它变得更明显。请留下一些其他有用的赏金，我很乐意再次帮助你。

http://www.annosoft.com/lipsync-sdks