Python音频分析:我可以从中提取哪些属性/值?

Python音频分析:我可以从中提取哪些属性/值?,python,signal-processing,analysis,audio-processing,Python,Signal Processing,Analysis,Audio Processing,我目前正在tkinter python学校的一个项目中工作,该项目的唯一目的是从音频文件生成图像,我将选择音频属性并将它们用作值,从中生成唯一的抽象图像,但是我不知道可以分析哪些属性来提取值。因此,我在寻找一些关于哪些属性(音频、振幅……等等)的指导,我可以从中提取值来使用Python生成图像。这个问题在当前的形式中非常广泛。 (请记住,音频不是我的专业领域,因此请留意音频/视听/生成领域工作人员的意见。) 你可以选择任何一种方式:找出你想从音频中创建什么类型的图像,然后找出要使用的音频功能。另

我目前正在tkinter python学校的一个项目中工作,该项目的唯一目的是从音频文件生成图像,我将选择音频属性并将它们用作值,从中生成唯一的抽象图像,但是我不知道可以分析哪些属性来提取值。因此,我在寻找一些关于哪些属性(音频、振幅……等等)的指导,我可以从中提取值来使用Python生成图像。

这个问题在当前的形式中非常广泛。 (请记住,音频不是我的专业领域,因此请留意音频/视听/生成领域工作人员的意见。)

你可以选择任何一种方式:找出你想从音频中创建什么类型的图像,然后找出要使用的音频功能。另一种方法也是有效的:选择一个你想探索的音频特性,然后想想你最好或者最有趣的视觉表现方式

图像和图像之间有区别。 对于单个图像,我能想到的最简单的事情是绘制一个正方形网格,其中正方形的视觉属性(例如正方形大小、填充颜色强度等)映射到当时的振幅。单个图像将显示整个轨迹的振幅模式。即使有这样一个简单的示例,您也可以做出许多选择(采样频率、网格布局(笛卡尔、极坐标)、每个振幅采样的可视化方式(可以是不同的形状、大小、颜色等)。 (与概念类似,仅音频更简单) 你可以在数据可视化领域寻找灵感。 这是一个很好的开始。

如果要生成似乎进入视听领域的图像(例如抽象动画、音频反应性运动图形等)。 您的问题最初带有标记,我将其删除,但是您可以使用Processing的Python模式

在ferms of audio Visualization中,我能想到的一个很好的例子是Robert Hogin的工作,参见和。他使用频率分析(FFT)和一些平滑/数据处理来放大对可视化有用的元素,并抑制一些噪音:

(有一些方便的音频库,例如和,但是我假设您对使用原始Python感兴趣,而不是Jython(官方处理Python模式使用Jython)。他是一个答案(即使是在处理Java中,原则也可以在Python中应用)

就我个人而言,到目前为止,我只在基本音频任务中使用pyaudio。我想你可以使用它进行振幅分析,但在其他更复杂的任务中,你可能需要一些额外的东西。 快速搜索弹出窗口

如果您想要实现的目标不明确,请先尝试原型设计,并从您能想到的最简单的音频分析和视觉元素开始(例如,随着时间的推移,振幅映射到方框)。限制可能对创造力有很大帮助,最小的方法可以转化为更清晰、最小的视觉效果

然后,您可以查看FFT、开始/节拍检测等

另一个对原型设计有用的工具是。 您可以打开曲目并使用一些内置的功能提取器。 (您甚至可以从Sonic Visualser导出XML或CSV数据,您可以在Python中加载/解析这些数据并使用它们渲染图像) 它使用了一个名为的插件系统(类似于DAW中的VST插件,如Abbleton Live、Apple Logic等),如果您在运行时需要数据,您可以使用Python包装器


(你可能还想从音像艺术作品中使用的其他语言中获得灵感,如。 (请记住,音频不是我的专业领域,因此请留意音频/视听/生成领域工作人员的意见。)

你可以这样做:找出你想从音频中创建什么类型的图像,并从中找出要使用的音频功能。另一种方法也是有效的:选择一个你想探索的音频功能,然后想想你最好或最有趣的视觉表现方式

图像和图像之间有区别。 对于单个图像,我能想到的最简单的事情是绘制一个正方形网格,其中正方形的视觉属性(例如,正方形大小、填充颜色强度等)映射到当时的振幅。单个图像将可视化整个轨迹的振幅模式。即使有这样一个简单的示例,您也可以做出许多选择(采样频率、网格布局(笛卡尔坐标、极坐标)、每个振幅采样的可视化方式(可以是不同的形状、大小、颜色等)。 (与概念类似,仅音频更简单) 你可以在数据可视化领域寻找灵感。 这是一个很好的开始。

如果要生成似乎进入视听领域的图像(例如抽象动画、音频反应性运动图形等)。 您的问题最初带有标记,我将其删除,但是您可以使用Processing的Python模式

在ferms of audio Visualization中,我能想到的一个很好的例子是Robert Hogin的工作,参见和。他使用频率分析(FFT)和一些平滑/数据处理来放大对可视化有用的元素,并抑制一些噪音:

(有一些方便的音频库,例如和,但是我假设您对使用原始Python感兴趣,而不是Jython(官方处理Python模式使用Jython)。他是一个答案(即使是在处理Java中,原则也可以在Python中应用)

就我个人而言,到目前为止,我只在基本音频任务中使用pyaudio。我想你可以使用它进行振幅分析,但在其他更复杂的任务中,你可能需要一些额外的东西。 快速搜索弹出窗口

如果你想要什么