Python 从音频记录中提取每个单词

Python 从音频记录中提取每个单词,python,signal-processing,voice-recognition,Python,Signal Processing,Voice Recognition,我想按音频文件中包含的每个单词来分隔音频文件。这是我的代码,它将非单词语音的振幅设置为零。我需要把信号一个字一个字地分开,如红线所示 import sys from scipy.io.wavfile import read import matplotlib.pyplot as plt average_voice_amplitude = 150 test_file = sys.argv[1] _, voice_signal = read(test_file) voice_signal = voi

我想按音频文件中包含的每个单词来分隔音频文件。这是我的代码,它将非单词语音的振幅设置为零。我需要把信号一个字一个字地分开,如红线所示

import sys
from scipy.io.wavfile import read
import matplotlib.pyplot as plt
average_voice_amplitude = 150
test_file = sys.argv[1]
_, voice_signal = read(test_file)
voice_signal = voice_signal.copy()
for amp in range(len(voice_signal[:, 0])):
    
        if abs(voice_signal[:, 0][amp])<average_voice_amplitude:
            voice_signal[:, 0][amp], voice_signal[:, 1][amp] = 0, 0
plt.plot(voice_signal)
plt.show()
导入系统 从scipy.io.wavfile导入读取 将matplotlib.pyplot作为plt导入 平均声音振幅=150 test_file=sys.argv[1] _,语音信号=读取(测试文件) 语音信号=语音信号。复制() 对于范围内的放大器(len(语音信号[:,0])): 如果abs(语音信号[:,0][amp])


此外,我对更好的算法持开放态度,这些算法对提取单词非常有用

任何想法,我都不知道该怎么做