Audio 音频数据的样本代表什么?

Audio 音频数据的样本代表什么?,audio,pcm,Audio,Pcm,我想知道单个音频数据样本(未压缩PCM)代表什么 这是一个数字,但这个数字到底是什么?它是如何转换回音频的 例如,如果是4位采样,0是否表示绝对静音,15是否表示最大音量 如果是音量,我们谈论的频率是多少?有关频率的信息是如何存储的 在歌曲中,我们可以同时听到各种乐器(频率),这意味着每个频率都以某种方式存储在一个样本中。这是怎么做到的?音频只是一条曲线,随着时间的左/右推移而上/下摆动。在给定的时间点,样本是曲线高度的度量。沉默是指曲线不摆动。。。它只是走直线。。。在值为零时,采样值为0(更准

我想知道单个音频数据样本(未压缩PCM)代表什么

这是一个数字,但这个数字到底是什么?它是如何转换回音频的

例如,如果是4位采样,0是否表示绝对静音,15是否表示最大音量

如果是音量,我们谈论的频率是多少?有关频率的信息是如何存储的


在歌曲中,我们可以同时听到各种乐器(频率),这意味着每个频率都以某种方式存储在一个样本中。这是怎么做到的?

音频只是一条曲线,随着时间的左/右推移而上/下摆动。在给定的时间点,样本是曲线高度的度量。沉默是指曲线不摆动。。。它只是走直线。。。在值为零时,采样值为0(更准确地说是从最大值到最小值范围的中间值)。。。当曲线向上或向下达到其最大高度时,音频的音量可能最大

规范化的概念很重要。。。曲线值的绝对范围(最大向上或向下)是任意的。。。可能是任何东西。。。假设最大值为15,最小值为0。。。请记住,静默是不抖动的,所以最大向上/向下静默的中间值约为7

曲线可以被编码成任意数量的位。。。这大致映射到你将曲线切割成多少条水平线。。。线条越多,位数越多,曲线高度样本值的准确性就越高

被认为是纯音。。。Joseph Fourier证明了任意曲线(音频或其他)可以以一组正弦曲线的形式存储(a)各种音量(最大上/下)(B)各种频率(C)各种相位偏移。。。有趣的是,这种转换在两个方向都起作用:从任意形状的曲线到一组(a/B/C)或从一组(a/B/C)再到合成任意形状的曲线(音频合成器就是这样工作的)

有关频率存储的信息被烘焙成曲线形状。。。这都是关于曲线上下摆动的频率。。。从中线下方到中线上方需要很长时间的缓慢摆动是低频率。。。一段密集的蠕动意味着高频的嘎嘎声

当一个麦克风记录多个人同时讲话或各种乐器都发出自己的声音时,我们有许多同时发生的频率,但不知何故,记录是如何工作的?想想麦克风里(或你的公寓里)发生了什么。。。它的线圈可以看作是一个平面(二维表面),只能在上下晃动。。。要么只是来回移动。。。这是一条任意曲线。。。一条曲线在某个时间点上的高度值是从最大值到最小值的

与主题无关,但这里有一个链接: