Python获取语音到文本语音音频数据_Python_Python 3.x_Audio

Python获取语音到文本语音音频数据

python python-3.x audio

Python获取语音到文本语音音频数据,python,python-3.x,audio,Python,Python 3.x,Audio,我需要你的帮助，因为目前我使用的是“pyttsx3”中的“engine.say（）”，所以我的程序与我“对话”。这已经在工作，但现在我想要一个音频可视化的声音我怎么能做到这一点例子我想要我所拥有的这已经可视化了我的麦克风音频，但我如何才能使声音成为源？希望你能帮助我，非常感谢我想你需要的是- 这样做的好处之一是启动流_读取器，使用PyAudio（声卡、麦克风等）从任何源提取实时音频数据由于您将使用pyttsx3播放音频，因此它可以从声卡中提取音频并显示实时可视化效果。这是一个更好

我需要你的帮助，因为目前我使用的是“pyttsx3”中的“engine.say（）”，所以我的程序与我“对话”。这已经在工作，但现在我想要一个音频可视化的声音我怎么能做到这一点

例子我想要

我所拥有的这已经可视化了我的麦克风音频，但我如何才能使声音成为源？

希望你能帮助我，非常感谢

我想你需要的是-

这样做的好处之一是

启动流_读取器，使用PyAudio（声卡、麦克风等）从任何源提取实时音频数据

由于您将使用

pyttsx3

播放音频，因此它可以从声卡中提取音频并显示实时可视化效果。这是一个更好的选择，为您的案件，而不是提取它通过麦克风

此外，如果音频由同一线程执行，则可能需要启用线程或多处理来可视化音频。这是一个很好的指南-

请尝试自己制作，然后带着更具体的问题来找我们。这真的很酷，谢谢。但这也只是我的麦克风而不是声音你知道为什么吗？你到底是什么意思？你能举个例子吗？如果您希望在不使用麦克风的情况下配置语音，请使用声卡选项进行配置。查看文档，了解如何实现这一点。很抱歉，我在github上找不到文档？或者，声卡的选项有了另一种外观-似乎指令只是一个管道，即声卡输入可以通过许多其他方式启用。一个例子是。当然，您可以按照您的意愿获取和执行任何方式。我只获取耳机和Microsoft Soundmapper（输入），但不获取语音？

import pyttsx3

engine = pyttsx3.init()

engine.say("Hello World")
engine.runAndWait()

import pyaudio
import struct
import matplotlib.pyplot as plt
import numpy as np

mic = pyaudio.PyAudio()
FORMAT = pyaudio.paInt16
CHANNELS = 1
RATE = 5000
CHUNK = 3000#int(RATE/20)
stream = mic.open(format=FORMAT, channels=CHANNELS, rate=RATE, input=True, output=True, frames_per_buffer=CHUNK)

fig, ax = plt.subplots(figsize=(14,6))
x = np.arange(0, 2 * CHUNK, 2)
ax.set_ylim(-500, 500)
ax.set_xlim(0, CHUNK)
line, = ax.plot(x, np.random.rand(CHUNK))


while True:
    data = stream.read(CHUNK)
    data = np.frombuffer(data, np.int16)
    line.set_ydata(data)
    fig.canvas.draw()
    fig.canvas.flush_events()
    plt.pause(0.01)