Audio 哪个特征、算法适合说话人验证

Audio 哪个特征、算法适合说话人验证,audio,similarity,verification,speech,speaker,Audio,Similarity,Verification,Speech,Speaker,我有一项任务,要进行说话人验证 我的任务是计算两个语音之间的相似性,然后与阈值进行比较。 示例:两个音频之间的相似性分数为70%,阈值为50%。因此,演讲者是同一个人 该演讲与文本无关,可以是任何对话 我在使用MFCC、GMM进行说话人识别任务时做了实验,但这个任务是不同的,只是比较两个音频特征来获得相似性分数。我不知道哪种特征适合说话人验证,哪种算法可以帮助我计算两种模式之间的相似性分数 希望能得到你们的建议 非常感谢。现在的最新技术是: Kaldi中的实现是。我也在研究用于说话人验证的TI

我有一项任务,要进行说话人验证

我的任务是计算两个语音之间的相似性,然后与阈值进行比较。 示例:两个音频之间的相似性分数为70%,阈值为50%。因此,演讲者是同一个人

该演讲与文本无关,可以是任何对话

我在使用MFCC、GMM进行说话人识别任务时做了实验,但这个任务是不同的,只是比较两个音频特征来获得相似性分数。我不知道哪种特征适合说话人验证,哪种算法可以帮助我计算两种模式之间的相似性分数

希望能得到你们的建议


非常感谢。

现在的最新技术是:


Kaldi中的实现是。

我也在研究用于说话人验证的TIMIT数据集。我已经提取了mfcc特征,并训练了一个UBM,并针对每个说话人进行了自适应。在自适应方面,我使用了对角矩阵。 如何测试wav文件?然而,当涉及到特征时,你可以使用音高和能量