Python获取语音到文本语音音频数据

Python获取语音到文本语音音频数据,python,python-3.x,audio,Python,Python 3.x,Audio,我需要你的帮助,因为目前我使用的是“pyttsx3”中的“engine.say()”,所以我的程序与我“对话”。这已经在工作,但现在我想要一个音频可视化的声音我怎么能做到这一点 例子 我想要 我所拥有的 这已经可视化了我的麦克风音频,但我如何才能使声音成为源? 希望你能帮助我,非常感谢 我想你需要的是- 这样做的好处之一是 启动流_读取器,使用PyAudio(声卡、麦克风等)从任何源提取实时音频数据 由于您将使用pyttsx3播放音频,因此它可以从声卡中提取音频并显示实时可视化效果。这是一个更好

我需要你的帮助,因为目前我使用的是“pyttsx3”中的“engine.say()”,所以我的程序与我“对话”。这已经在工作,但现在我想要一个音频可视化的声音我怎么能做到这一点

例子 我想要

我所拥有的 这已经可视化了我的麦克风音频,但我如何才能使声音成为源?
希望你能帮助我,非常感谢

我想你需要的是-

这样做的好处之一是

启动流_读取器,使用PyAudio(声卡、麦克风等)从任何源提取实时音频数据

由于您将使用
pyttsx3
播放音频,因此它可以从声卡中提取音频并显示实时可视化效果。这是一个更好的选择,为您的案件,而不是提取它通过麦克风


此外,如果音频由同一线程执行,则可能需要启用线程或多处理来可视化音频。这是一个很好的指南-

请尝试自己制作,然后带着更具体的问题来找我们。这真的很酷,谢谢。但这也只是我的麦克风而不是声音你知道为什么吗?你到底是什么意思?你能举个例子吗?如果您希望在不使用麦克风的情况下配置语音,请使用声卡选项进行配置。查看文档,了解如何实现这一点。很抱歉,我在github上找不到文档?或者,声卡的选项有了另一种外观-似乎指令只是一个管道,即声卡输入可以通过许多其他方式启用。一个例子是。当然,您可以按照您的意愿获取和执行任何方式。我只获取耳机和Microsoft Soundmapper(输入),但不获取语音?
import pyttsx3

engine = pyttsx3.init()

engine.say("Hello World")
engine.runAndWait()
import pyaudio
import struct
import matplotlib.pyplot as plt
import numpy as np

mic = pyaudio.PyAudio()
FORMAT = pyaudio.paInt16
CHANNELS = 1
RATE = 5000
CHUNK = 3000#int(RATE/20)
stream = mic.open(format=FORMAT, channels=CHANNELS, rate=RATE, input=True, output=True, frames_per_buffer=CHUNK)

fig, ax = plt.subplots(figsize=(14,6))
x = np.arange(0, 2 * CHUNK, 2)
ax.set_ylim(-500, 500)
ax.set_xlim(0, CHUNK)
line, = ax.plot(x, np.random.rand(CHUNK))


while True:
    data = stream.read(CHUNK)
    data = np.frombuffer(data, np.int16)
    line.set_ydata(data)
    fig.canvas.draw()
    fig.canvas.flush_events()
    plt.pause(0.01)