Audio 用于机器学习数据集的不同话筒

Audio 用于机器学习数据集的不同话筒,audio,tensorflow,machine-learning,Audio,Tensorflow,Machine Learning,我目前正在学习Tensorflow简单音频识别教程 我想知道在我的数据集中使用不同的麦克风录制音频是否会对我的培训结果产生负面影响。所有音频是否应使用同一类型的麦克风录制 这取决于您将来如何使用经过培训的模型。如果您希望此型号能够与不同类型的话筒配合使用,并且假设不同的话筒会影响实际录制的音频,那么您可能希望使用各种话筒进行录制 或者,您也可以描述不同话筒产生的差异,并修改数据集,使样本包含话筒之间的差异。这被称为数据扩充,是一种非常常见且推荐的做法,但这不一定是一项容易的任务。数据扩充通常特定

我目前正在学习Tensorflow简单音频识别教程
我想知道在我的数据集中使用不同的麦克风录制音频是否会对我的培训结果产生负面影响。所有音频是否应使用同一类型的麦克风录制

这取决于您将来如何使用经过培训的模型。如果您希望此型号能够与不同类型的话筒配合使用,并且假设不同的话筒会影响实际录制的音频,那么您可能希望使用各种话筒进行录制

或者,您也可以描述不同话筒产生的差异,并修改数据集,使样本包含话筒之间的差异。这被称为数据扩充,是一种非常常见且推荐的做法,但这不一定是一项容易的任务。数据扩充通常特定于您使用的数据集和数据类型,因此这可能只是您希望采用的数据扩充的一个示例。音频的另一个典型示例是添加不同类型的背景噪声,以产生一个更大的独特数据集,它必须在其中选择所需的信号

另一方面,您将只在特定的麦克风上使用您的型号,然后只使用该麦克风对其进行训练是有意义的,因为您不关心使用不同的麦克风时它的性能会有多好或差

如果这只是一个学习练习,那么我就不会担心这个细节了。事实上,在我看来,不同的话筒不太可能产生明显不同的音频模式。但是,嘿,我很可能错了


我喜欢从一个非常人性化的角度来思考这样的问题。问问自己:如果我要雇佣一名数据录入人员来执行这项任务,我会给他们举几个例子来教他们如何执行这项任务,如果这些样本来自多个麦克风,会对他们有好处吗?如果答案是肯定的,那么就像对待人类一样对待学习算法,并赋予它们相同的种类。

因此,如果我要在物联网设备上运行该算法,我应该使用相同的麦克风来获取设备上的数据集。到目前为止,我一直在从youtube视频中收集音频数据,但在一个我知道硬件的应用程序中,我应该直接从那种类型的硬件中获取音频数据?一般来说,是的,但是,我不会把它放在很高的优先级上,因为它似乎不太可能对您的结果产生重大影响。