Python 如何使用音频文件?

Python 如何使用音频文件?,python,audio,Python,Audio,数字图像由多个像素组成,每个像素都有一些表示相应颜色强度的值。如果我想处理图像,我可以简单地读取或更改像素。例如,出于科学目的,有一个以可读的ASCII格式逐个编码每个像素的 有没有类似的方法来读取或修改音频文件?音频是如何编辑的?音频记录的组成部分、最小部分和“像素”是什么?有ASCII声音文件格式吗?这可能完全脱离主题,但现在您可以 音频文件由代表特定时间点的空气运动的样本组成。对于CD质量,即每秒44100个样本,每个样本16位 我不认为将其可视化为ASCII会非常有用。每个示例至少需要3

数字图像由多个像素组成,每个像素都有一些表示相应颜色强度的值。如果我想处理图像,我可以简单地读取或更改像素。例如,出于科学目的,有一个以可读的ASCII格式逐个编码每个像素的


有没有类似的方法来读取或修改音频文件?音频是如何编辑的?音频记录的组成部分、最小部分和“像素”是什么?有ASCII声音文件格式吗?

这可能完全脱离主题,但现在您可以


音频文件由代表特定时间点的空气运动的样本组成。对于CD质量,即每秒44100个样本,每个样本16位


我不认为将其可视化为ASCII会非常有用。每个示例至少需要3个字符,即每秒132300个字符的声音,或者一首5分钟的歌曲需要39690000个字符(即4000万个字符)。

您使用的是什么语言?Python,但这是一个一般性问题。您应该适当地标记它(你也可以提到,这是一个一般性问题,不只是针对这种语言)。很少有人使用音频标签,甚至不知道使用什么来提供帮助,因此你不太可能得到任何答案。良好的标签(没有垃圾邮件)这将大大增加你获得答案的机会。这个问题对于SO来说太过宽泛和离题。请参阅。包含一个非常容易理解的介绍。“表示某个时间点的空气运动”-不!它表示特定时间内最大输出电压或电流的百分比。这与空气流动无关。请不要回答离题问题。@Olaf First:输出电压肯定与空气流动有关。否则它将不是音频文件,而是电压表读数数据文件。其次,我是not 100%确定这是离题。理解文件格式是编程的一部分,这是一个WAV格式的主题。但这绝对不是Python的问题。听音频不需要任何空气运动。可以像耳蜗植入一样直接刺激神经。或者更常见的是,使用骨骼刺激。在处理时,有也不涉及空气(除非您的计算机使用气动)。即使您使用空气作为媒介将音频发送到耳朵,数据也不会编码空气运动,而是(简化)膜的位置。空气运动是交替位置的结果,而不是直接由数据字编码。因此,是的,它是一个“电压比"编码。而且没有提到
WAV
格式。@Olaf Hahaha这意味着位图的值与RGB颜色的光强度无关,而只表示视觉神经中的电脉冲水平!这是错误的。同样,音频文件表示声音,声音定义为机械波。不是当然是在空气中,但通常当我们谈论声音时,我们指的是空气中的振动。电对于声音、事实上对于计算机或任何与音频文件有关的东西来说绝对不是必不可少的。“音频文件由代表某个时间点的空气运动的样本组成”-我没有对音频文件发表评论,但你对单个样本的定义是什么。无论如何,与无知的人讨论是没有用的,你忽略了关于音频文件的实际要点。请尽情地笑吧,Pennywise。