Audio 数字会话的开关标记
在双方的正常对话中,比如说a和B,可能会发生四种情况:1)a和B都交谈2)a交谈,B沉默3)a沉默,B交谈4)a和B都沉默 我想创建一个文本文件,在该文件中,我报告会话处于哪种状态,每个时间窗口为几毫秒Audio 数字会话的开关标记,audio,media,signal-processing,Audio,Media,Signal Processing,在双方的正常对话中,比如说a和B,可能会发生四种情况:1)a和B都交谈2)a交谈,B沉默3)a沉默,B交谈4)a和B都沉默 我想创建一个文本文件,在该文件中,我报告会话处于哪种状态,每个时间窗口为几毫秒 特别是,我想知道[基于一些示例对话]是否已经有了这方面的存储库,如果没有,我如何做到这一点,因为我在这方面没有太多的经验(或者我是否可以使用一个应用程序)。假设我们假设双方的发言完全相同,您可以使用基音确定算法来识别用户的单个基音,然后在所有帧上进行比较。如果您只有一个记录,其中包含来自a和B的
特别是,我想知道[基于一些示例对话]是否已经有了这方面的存储库,如果没有,我如何做到这一点,因为我在这方面没有太多的经验(或者我是否可以使用一个应用程序)。假设我们假设双方的发言完全相同,您可以使用基音确定算法来识别用户的单个基音,然后在所有帧上进行比较。如果您只有一个记录,其中包含来自a和B的信号之和,则很难对任意信号执行此操作。如果你像在电话或调制解调器中那样拥有信号的总和和其中一个信号,那就容易多了。