Nlp 如何计算音频文件中的语音音节数?

Nlp 如何计算音频文件中的语音音节数?,nlp,speech-recognition,Nlp,Speech Recognition,我有许多干净的音频文件,只有普通话语音。我需要估计每个文件中有多少音节。是否有一个适用于OSX、Windows或Linux的工具可以评估这些问题 sample01.wav 15 sample02.wav 8 sample03.wav 5 sample04.wav 1 sample05.wav 18 由于文件较多,建议使用命令行或批处理软件,例如: $ application sample01.wav 15 使用语音转换为文本,然后统计出现的字符数的解决方案适用于 您可以使用共振峰来确定这一

我有许多干净的音频文件,只有普通话语音。我需要估计每个文件中有多少音节。是否有一个适用于OSX、Windows或Linux的工具可以评估这些问题

sample01.wav 15
sample02.wav 8
sample03.wav 5
sample04.wav 1
sample05.wav 18
由于文件较多,建议使用命令行或批处理软件,例如:

$ application sample01.wav
15
  • 使用语音转换为文本,然后统计出现的字符数的解决方案适用于

您可以使用共振峰来确定这一点。每个音节都应该对应一个共振峰。以下是关于共振峰的更多信息:


语音自动分割是一个活跃的科学领域,这意味着没有一种方法可以完美地工作

2009年,de Jong和Wempe提出了一种方法,通过使用语音信号自动检测人类语音信号中的音节。该方法与人工分割方法相比效果良好,并已在许多第三方科学研究中得到应用。您可以在他们的科学文章()中找到该方法的详细描述,以及对以前提出的方法的历史观点。Praat脚本本身和一些教程可以在专门的网站()上找到


您可能还对由开发的另一个分割算法感兴趣,该算法已在Matlab()中实现。

这可能会让您感兴趣


您的问题需要特别注意,并针对语音到文本的转换提出解决方案。 我真的怀疑任何免费的开源库,容易获得和服务的目的将得到满足

我使用了一个,但目的相反“文本到语音”。 虽然这不是一个免费的图书馆,但我很乐意帮助谷歌“annosoft lipsync”


该库也可用于SDK评估……

我只是想知道如何奖励一个答案(来自@navneet3571)而这个答案位于我的后面,并且只包含我在答案中给出的一个链接。看起来不公平不?对不起,我搞错了。我知道演讲稿解决了这个问题,但我没有意识到它在两篇不同的帖子中被提及。当我有更多的分数时,我会找到一些方法来奖励你赏金分数。那很好,我可以让它变得更明显。请留下一些其他有用的赏金,我很乐意再次帮助你。
http://www.annosoft.com/lipsync-sdks