Python 获取音频文件中每个单词的持续时间
是否有可能获得音频文件中每个单词的大致持续时间?最接近的方法(对于youtube视频中的音频文件)是将字幕文件作为Python 获取音频文件中每个单词的持续时间,python,audio,machine-learning,audacity,aubio,Python,Audio,Machine Learning,Audacity,Aubio,是否有可能获得音频文件中每个单词的大致持续时间?最接近的方法(对于youtube视频中的音频文件)是将字幕文件作为srt下载。然后,srt将具有视频中每个句子的持续时间 我想知道是否有可能以某种方式获得句子中每个单词的持续时间。也许不准确,但大概是这样的?与python的连接是什么?至于这个问题:单词是以安静的时间段来分隔的。搜索仅具有背景/环境噪声级的间隔。除非你有额外的信息,否则这是一项不平凡的任务。有一些库可以为您提供检测或语音区域与非语音区域,也称为语音活动检测,但这只是一个起点,因为它
srt
下载。然后,srt
将具有视频中每个句子的持续时间
我想知道是否有可能以某种方式获得句子中每个单词的持续时间。也许不准确,但大概是这样的?与python的连接是什么?至于这个问题:单词是以安静的时间段来分隔的。搜索仅具有背景/环境噪声级的间隔。除非你有额外的信息,否则这是一项不平凡的任务。有一些库可以为您提供检测或语音区域与非语音区域,也称为语音活动检测,但这只是一个起点,因为它不会给您单词之间的边界。\@boardrider:在自然语音中,大多数单词之间没有停顿。@ItamarKatz您能指出这样的库吗(用于检测语音区域)。正如你所说,这可能是一个起点。这取决于你使用的语言/平台。在谷歌上寻找“语音活动检测”作为起点