Python 3.x 在Windows机器上运行Wav2Litter Facebook AI Research语音到文本模型的替代方法_Python 3.x_Deep Learning_Speech Recognition_Speech To Text

Python 3.x 在Windows机器上运行Wav2Litter Facebook AI Research语音到文本模型的替代方法

python-3.x deep-learning speech-recognition

Python 3.x 在Windows机器上运行Wav2Litter Facebook AI Research语音到文本模型的替代方法,python-3.x,deep-learning,speech-recognition,speech-to-text,Python 3.x,Deep Learning,Speech Recognition,Speech To Text,我正在尝试使用wav2letter实现语音到文本的转换。据我所研究，该模型使用Arrayfire张量库，并依赖于flashlight ML库现在，flashlight库是为基于Linux的系统构建的是否有任何方法可以在基于Windows的系统上运行此模型。无论您是否尝试训练或运行推理管道，除了尝试从MSVC（当前不支持）的源代码获取所有要构建的内容外，您还有两个选择使用创建和构建所有内容。您应该能够使用通过Docker连接到机器的GPU。现在还有一个应该在您的机器上运行的，不包括许多其他依

我正在尝试使用wav2letter实现语音到文本的转换。据我所研究，该模型使用Arrayfire张量库，并依赖于flashlight ML库

现在，flashlight库是为基于Linux的系统构建的

是否有任何方法可以在基于Windows的系统上运行此模型。

无论您是否尝试训练或运行推理管道，除了尝试从MSVC（当前不支持）的源代码获取所有要构建的内容外，您还有两个选择

使用创建和构建所有内容。您应该能够使用通过Docker连接到机器的GPU。现在还有一个应该在您的机器上运行的，不包括许多其他依赖项的

如果可以，在Windows计算机上构建Linux子系统中的所有内容。推理管道至少应该在那里工作

Wav2Letter

具有不同的训练和推理时间依赖关系

我假设您将在CUDA后端执行培训。如果是这样，您需要

阵列点火

和

手电筒

对于推理，除了基本的依赖性（例如序列化的

grane

等），您也不需要任何依赖性。FAIR团队基于FBGEMM（FB通用矩阵乘法）后端提供了自己的神经网络层实现（线性、conv1d等）。FBGEMM可以为CPU和CUDA后端编译—在基于英特尔的CPU上，可以使用英特尔优化的MKL数学库进一步加速FBGEMM，在CUDA后端使用cuDNN进一步加速FBGEMM

< >您可以自由添加基于LibTorch、C++或TysFooFad的后端实现，并提交PR.< /P>