Audio 根据音频源和准确的转录,为来自任何语言的音频添加时间戳

Audio 根据音频源和准确的转录,为来自任何语言的音频添加时间戳,audio,transcription,Audio,Transcription,我希望获得音频文件中每个单词的大致准确的时间戳。我也有原始文本去与音频文件,可以作为各种交叉引用源使用。这类似于“音频挖掘”,我认为这是一种只包含输入音频的方法,而这里我同时包含音频和文本 理想情况下,我希望使用开源软件来实现这一点,并希望接受大多数语言作为输入(例如,英语、法语、德语、西班牙语,最好是俄语和普通话) 我甚至会接受一种只能匹配不同单词的时间戳的解决方案(例如,如果转录不完全准确)。然后将输出文本与原始文本交叉引用,以帮助重新调整内容会更容易。我在语言学研究中就是这样做的。我使用了

我希望获得音频文件中每个单词的大致准确的时间戳。我也有原始文本去与音频文件,可以作为各种交叉引用源使用。这类似于“音频挖掘”,我认为这是一种只包含输入音频的方法,而这里我同时包含音频和文本

理想情况下,我希望使用开源软件来实现这一点,并希望接受大多数语言作为输入(例如,英语、法语、德语、西班牙语,最好是俄语和普通话)


我甚至会接受一种只能匹配不同单词的时间戳的解决方案(例如,如果转录不完全准确)。然后将输出文本与原始文本交叉引用,以帮助重新调整内容会更容易。

我在语言学研究中就是这样做的。我使用了一个名为ELAN的程序,我刚刚注意到他们的版本(4.5)比我目前在Mac上安装的版本更新。该软件旨在帮助处理聋人语言,因此它支持视频和音频帧,并允许您准确地对齐转录。我使用的版本是3.9,这个版本用来做一些自动分词,这是我想你想要做的。不过,我在最新版本中没有看到这一功能,也许经过一些挖掘,它仍然存在

当然,如果您需要早期版本,您可以始终使用ELAN 3.9。ELAN在Mac、Linux和Windows上工作,因为它基于Java(我记得)。这里是到的链接。还有其他的语言注释软件。另一个很好,但是很难学。它被称为

我希望这对你有帮助。如果我没有完全正确地理解您的需求,请告诉我,我会看看是否可以为您完善我的答案。干杯