Audio 距离相关的中国餐馆流程

Audio 距离相关的中国餐馆流程,audio,machine-learning,cluster-analysis,unsupervised-learning,Audio,Machine Learning,Cluster Analysis,Unsupervised Learning,我是机器学习新手,希望在MATLAB中实现与距离相关的中餐厅过程,以便对音频轨迹进行聚类 我希望在26个功能上使用dd CRP。我猜这个过程可能是这样的 读入第一个特征向量并为其指定一个“表” 读入第二个特征向量并将其与第一个“表”进行比较,可能使用两个向量的余弦角(由于高维),如果在某个定义的θ范围内一致,则加入该表,否则开始新的一个 读入下一个特征,对每个现有表格的新特征向量重复步骤2 在发生这种情况时,我将跟踪有多少个表 我将在例如16个音轨上运行算法。音频输入算法的方式是,第一个特征

我是机器学习新手,希望在MATLAB中实现与距离相关的中餐厅过程,以便对音频轨迹进行聚类

我希望在26个功能上使用dd CRP。我猜这个过程可能是这样的

  • 读入第一个特征向量并为其指定一个“表”
  • 读入第二个特征向量并将其与第一个“表”进行比较,可能使用两个向量的余弦角(由于高维),如果在某个定义的θ范围内一致,则加入该表,否则开始新的一个
  • 读入下一个特征,对每个现有表格的新特征向量重复步骤2
  • 在发生这种情况时,我将跟踪有多少个表
我将在例如16个音轨上运行算法。音频输入算法的方式是,第一个特征向量来自音频轨道1的第一帧,第二个特征向量来自轨道2的第一帧,等等。因为我试图找出哪些音频轨道最喜欢聚集在一起,但我不想定义有多少质心。显然,我必须跟踪哪个音轨在哪个“桌子”上


这有意义吗?

您可以使用
X-means
算法,该算法根据贝叶斯信息标准(或BIC)自动确定最佳质心数(从而确定簇数)。简而言之,该算法查找每个簇的密度以及每个簇与其他簇的距离。

您可以使用
X-means
算法,该算法根据贝叶斯信息标准(或BIC)自动确定最佳质心数(从而确定簇数)。简而言之,该算法查找每个集群的密度,以及每个集群与其他集群之间的距离。

这不是一个中餐馆流程。这是一个启发式算法,与中餐馆的流程有一些相似之处。在CRP中,所有内容都是根据项目分配给集群的优先级来表述的(表类比),这些优先级与每个集群的似然函数相结合(这将使您描述的相似性函数形式化)。然后通过Gibbs采样进行推断,这意味着在给定所有其他分配的情况下,非确定性采样每个轨迹依次分配给哪个簇。非参数变分方法仍处于非常初步的阶段


为什么要使用CRP?你认为除了传统的聚类方法之外,你还能从中得到什么吗?实现和正确理解非参数的门槛很高,而且由于我提到的推理限制,它们目前通常没有什么实际用途。

这不是一个中餐馆流程。这是一个启发式算法,与中餐馆的流程有一些相似之处。在CRP中,所有内容都是根据项目分配给集群的优先级来表述的(表类比),这些优先级与每个集群的似然函数相结合(这将使您描述的相似性函数形式化)。然后通过Gibbs采样进行推断,这意味着在给定所有其他分配的情况下,非确定性采样每个轨迹依次分配给哪个簇。非参数变分方法仍处于非常初步的阶段


为什么要使用CRP?你认为除了传统的聚类方法之外,你还能从中得到什么吗?实现和正确理解非参数的门槛很高,由于我提到的推理限制,它们目前通常没有什么实际用途。

我们喜欢用代码处理特定问题。我看你还没有发任何邮件。尝试添加一些以获得我们的一些响应。恐怕我还没有为dd CRP编写任何代码。我只是想看看这个理论和我对这个问题的理解是否正确。我写了很多代码来处理音频,并使用k-means对其进行聚类,这是可行的,但我希望对其进行扩展。这可能与matlab无关。请删除matlab标签。我们喜欢用代码处理特定问题。我看你还没有发任何邮件。尝试添加一些以获得我们的一些响应。恐怕我还没有为dd CRP编写任何代码。我只是想看看这个理论和我对这个问题的理解是否正确。我写了很多代码来处理音频,并使用k-means对其进行聚类,这是可行的,但我希望对其进行扩展。这可能与matlab无关。请删除matlab标签。非常感谢。这正是我要找的!非常感谢你。这正是我要找的!嗨,本。谢谢你回复我。我之所以要看CRP,是因为有无限多的簇。我实际上想做的是从多声道录音中对音频曲目进行聚类。传统上,在音频制作中,您会根据这些内容对这些音频曲目进行分组,即将鼓与其他鼓分组,将吉他与其他吉他分组。我从每个音轨中提取低级特征,并基于这些特征对它们进行聚类,而不是遵循传统的声音工程实践,这通常只是一个经验法则。在这种情况下,我可能会更好地研究时间序列聚类吗?我认为一般聚类是可以的,还有一些聚类方法不需要预先指定聚类数(尽管CRP是无限模型,但对于有限数量的数据点,聚类数总是有限的)。以DBSCAN为例,它非常流行,您不必费劲寻找实现。我同意集群数量有限,但我希望数据定义应该有多少集群。总之