Python 3.x 在Windows机器上运行Wav2Litter Facebook AI Research语音到文本模型的替代方法
我正在尝试使用wav2letter实现语音到文本的转换。据我所研究,该模型使用Arrayfire张量库,并依赖于flashlight ML库 现在,flashlight库是为基于Linux的系统构建的Python 3.x 在Windows机器上运行Wav2Litter Facebook AI Research语音到文本模型的替代方法,python-3.x,deep-learning,speech-recognition,speech-to-text,Python 3.x,Deep Learning,Speech Recognition,Speech To Text,我正在尝试使用wav2letter实现语音到文本的转换。据我所研究,该模型使用Arrayfire张量库,并依赖于flashlight ML库 现在,flashlight库是为基于Linux的系统构建的 是否有任何方法可以在基于Windows的系统上运行此模型。无论您是否尝试训练或运行推理管道,除了尝试从MSVC(当前不支持)的源代码获取所有要构建的内容外,您还有两个选择 使用创建和构建所有内容。您应该能够使用通过Docker连接到机器的GPU。现在还有一个应该在您的机器上运行的,不包括许多其他依
是否有任何方法可以在基于Windows的系统上运行此模型。无论您是否尝试训练或运行推理管道,除了尝试从MSVC(当前不支持)的源代码获取所有要构建的内容外,您还有两个选择
Wav2Letter
具有不同的训练和推理时间依赖关系
我假设您将在CUDA后端执行培训。如果是这样,您需要阵列点火
和手电筒
对于推理,除了基本的依赖性(例如序列化的grane
等),您也不需要任何依赖性。FAIR团队基于FBGEMM(FB通用矩阵乘法)后端提供了自己的神经网络层实现(线性、conv1d等)。FBGEMM可以为CPU和CUDA后端编译—在基于英特尔的CPU上,可以使用英特尔优化的MKL数学库进一步加速FBGEMM,在CUDA后端使用cuDNN进一步加速FBGEMM
< >您可以自由添加基于LibTorch、C++或TysFooFad的后端实现,并提交PR.< /P>