Audio 我需要将立体声音频转换为单声道进行FFT吗?

Audio 我需要将立体声音频转换为单声道进行FFT吗?,audio,fft,Audio,Fft,我发现大多数其他问题都在问如何将立体声转换为单声道,但我想知道,为了进行FFT,是否需要将音频数据从立体声转换为单声道?如果我不知道,我知道在两个通道上进行FFT,但是我如何使用它们来找到音频的分形维数呢?如果我这样做了,将这两个值取平均值是一个好主意吗 而且我有数百万个点,当你看它们时,你会看到音频信号是什么样子。如果我有很多点,为什么我要做一个只有1024字节的FFT呢 这是我正在使用的音频格式: PCM_签名44100.0 Hz,16位,立体声,4字节/帧,小端 当我从流中读取时,缓冲区可

我发现大多数其他问题都在问如何将立体声转换为单声道,但我想知道,为了进行FFT,是否需要将音频数据从立体声转换为单声道?如果我不知道,我知道在两个通道上进行FFT,但是我如何使用它们来找到音频的分形维数呢?如果我这样做了,将这两个值取平均值是一个好主意吗

而且我有数百万个点,当你看它们时,你会看到音频信号是什么样子。如果我有很多点,为什么我要做一个只有1024字节的FFT呢

这是我正在使用的音频格式: PCM_签名44100.0 Hz,16位,立体声,4字节/帧,小端

当我从流中读取时,缓冲区可能得到的示例:[41,0,68,0]

如果我只是将两者平均起来,我就是这样做的:

amplitude1 = (double) (buffer[1] << 8 | buffer[0] & 0xFF) / 32767.0;
amplitude2 = (double) (buffer[3] << 8 | buffer[2] & 0xFF) / 32767.0;
double aveAmp = (amplitude2+amplitude1)/2;

amplitude1=(double)(buffer[1]声音的真实性不是单声道或立体声,而是空间中的一个场。“立体声”是一种简单的数据压缩形式,它利用了我们耳朵的不足。单声道只是稍微进一步


也就是说,“分形维数”对于音频来说并没有很好的定义。以stero为例,你可以使用左声道作为X坐标,右声道作为Y坐标,你会得到一个带有相关分形维数的2D路径。这与等效“mono”的分形维数完全无关对同一声音的一维解释;立体声分形维数将测量真实的立体声内容。(在立体声中通过简单复制信号来Truning mon将创建一个1.0的立体分形维数,因为L=R始终是一条线)

你所说的“音频分形维数”是什么意思?en.wikipedia.org/wiki/Fractal_dimension所以在做FFT之后,我会使用一些公式,它会找到功率谱或类似的东西,然后我会从中得到分形维数。听起来你好像在问一些问题,完全不清楚你想用分形维数做什么。一般来说对于“我是否需要从立体声转换为单声道”的回答是“视情况而定”,所以你可能想解释你做fft的目的。你试图测量/完成什么?在我的高级研究中,我正在确定通过使用不同程度的插值生成的音乐的分形,以查看在比较时分形是否有差异。数学和MIDI音乐已经完成,我可以转换我的MIDI数据很容易转换成真实的音频数据。我到处都能看到如何进行FFT,但没有人解释任何准备工作。比如,如果我有3000万个表示波形的pts,那么为了进行FFT,我接下来需要做什么?根据采样率对pts进行划分,然后对这个子集进行FFT?关于我所说的分形音乐。看看这个链接,它显示了一些研究人员是如何研究大量以前的音乐并确定它们的分形的。这就是我用我的音乐拍摄的目的。回到我的标题问题。我确信我只是将两者平均起来,所以我诚实地问这个问题,这样我肯定能帮助任何想知道的人因为我真的想把这个标记为答案,我的结果数据却不这么说。根据我的音频数据,如果我把左边画成y,右边画成x,我会得到两个不同的图形,反之亦然,因为我得到两个通道的两个不同值。尽管我同意,我会得到一个完全不同的分形图AL的尺寸是我拿了立体声还是单声道。我已经开始接受把这两者平均化了,但是我现在的两难境地是决定是否接受整首歌曲的傅立叶变换,或者一次做1024个样本。我不知道为什么我会考虑做一个样本,而不是从整个歌曲的FT开始。我有更高的分辨率。而且如果我做了一个示例,我甚至不知道如何将所有FFT组合在一起。@user2567273:如果你得到两个图形,你就做错了。不要绘制x(t)和y(t);绘制y(x)相反,这个图有它自己的分维,对于立体声来说,这是一个合适的分维,但这是你需要的吗?至于对整首歌进行FFT,这意味着什么?当然,你得到了一个很好的分辨率,可能在437.31赫兹处出现峰值。这并不意味着在整个3分钟内有一个持续的437.21音符。我是说你可以ld绘图y(x)两次,有两个不同的图形,因为第一个通道是x,第二个通道是y。我需要的是找到我生成的歌曲的分形维数。如果正确的答案是使用立体声而不是单声道,我将使用立体声。这会如何影响我的fft结果,或者我会找到f分形维数直接来自于这个情节,又是如何产生的?顺便说一句,你对我帮助很大,非常感谢!@user2567273:这只会使图形围绕x=y对角线旋转,而不会影响分形维数。但主要问题是你仍然不明白歌曲的分形维数根本不存在。