Nlp 语音识别：检测日语假名（辅音和元音）_Nlp_Speech Recognition

Nlp 语音识别：检测日语假名（辅音和元音）

nlp speech-recognition

Nlp 语音识别：检测日语假名（辅音和元音）,nlp,speech-recognition,Nlp,Speech Recognition,我想找到一些开源代码（虽然我会满足于封闭源代码产品）来转换传入的日语假名音频流（即辅音+元音对），并实时打印出来然而，我想使用这些基本的声音单位来定制自己的目的，所以我不希望任何试图提取真正日语单词的高级处理。我只想得到原始的假名有人知道这种技术吗我今天才知道日语的“字母表”基本上是一个10x5的网格。10列（空+9个辅音）和5行（元音）每个元素称为“假名”，语言由这些假名的序列组成；这些是基本的构件这肯定会对语音识别算法产生很大影响对于西方语言，我所知道的所有商业语音识别引擎都是基

我想找到一些开源代码（虽然我会满足于封闭源代码产品）来转换传入的日语假名音频流（即辅音+元音对），并实时打印出来

然而，我想使用这些基本的声音单位来定制自己的目的，所以我不希望任何试图提取真正日语单词的高级处理。我只想得到原始的假名

有人知道这种技术吗

我今天才知道日语的“字母表”基本上是一个10x5的网格。10列（空+9个辅音）和5行（元音）

每个元素称为“假名”，语言由这些假名的序列组成；这些是基本的构件

这肯定会对语音识别算法产生很大影响

对于西方语言，我所知道的所有商业语音识别引擎都是基于三元模型的：它用唯一的MFCC向量表示三个音素之间的每一个移动，并计算出一个语音最可能的三元序列（从中，它可以推断出微不足道的音素，然后浏览三胞胎词典，找出最可能的句子）

但是对于像日语这样的语言，我想这可能不再是最有效的算法了

相反，尝试捕捉每个单独的假名或假名对可能是有意义的

…可能是2克或4克，但不是3克

有什么东西吗？或者他们只是使用西方世界使用的相同引擎吗？

朱利叶斯有日语的声学和语言模型。试一试，看看它是否适合你的应用

我不知道他们训练了语言模型，但是朱利叶斯可以支持任何顺序的n-gram 反向传球。在向前传球时，它支持双字符。在反向传球时通常使用4-gram 通过。使用Julius工具将两个LM组合在一起

路易斯 ASR实验室