Python Pyaudio-将声音数据转换为字符串的算法
我使用Pyaudio来录制和提取录制声音中的数据。现在我录制了一个声音并用Python Pyaudio-将声音数据转换为字符串的算法,python,algorithm,python-3.4,pyaudio,Python,Algorithm,Python 3.4,Pyaudio,我使用Pyaudio来录制和提取录制声音中的数据。现在我录制了一个声音并用matplotlib显示 import pyaudio,numpy import matplotlib.pyplot as plt FORMAT = pyaudio.paFloat32 SAMPLEFREQ = 44100 FRAMESIZE = 1024 NOFFRAMES = 220 p = pyaudio.PyAudio() print('running') stream = p.open(format=FORM
matplotlib
显示
import pyaudio,numpy
import matplotlib.pyplot as plt
FORMAT = pyaudio.paFloat32
SAMPLEFREQ = 44100
FRAMESIZE = 1024
NOFFRAMES = 220
p = pyaudio.PyAudio()
print('running')
stream = p.open(format=FORMAT,channels=1,rate=SAMPLEFREQ,input=True,frames_per_buffer=FRAMESIZE)
data = stream.read(NOFFRAMES*FRAMESIZE)
decoded = numpy.fromstring(data, 'Float32')
for x in decoded:
if x != 0.0: #
print (x) #--- decoded is very huge, I just print the first float number
break #
stream.stop_stream()
stream.close()
p.terminate()
print('done')
plt.plot(decoded)
plt.show()
该代码的输出示例如下:
我的主要目标是找出解码后的中的浮点数,并将它们转换为字符串。例如,我想检测我是否录制了aaa
,我想处理该录制数据的数据,并在最后将其转换为aaa
decoded
是一个庞大的浮点数列表,所以我找不到处理它的方法。我愿意听取关于图书馆的建议,以及实现这一目标的正确算法
在我看来,我使用了错误的库,但找不到实现我目标的正确库/方法 听起来像是你在征求关于使用python进行“语音(音频)到文本(字符串)”转换的建议。有一些很棒的API和python库用于执行语音到文本的转换: