Nlp 语音识别:检测日语假名(辅音和元音)

Nlp 语音识别:检测日语假名(辅音和元音),nlp,speech-recognition,Nlp,Speech Recognition,我想找到一些开源代码(虽然我会满足于封闭源代码产品)来转换传入的日语假名音频流(即辅音+元音对),并实时打印出来 然而,我想使用这些基本的声音单位来定制自己的目的,所以我不希望任何试图提取真正日语单词的高级处理。我只想得到原始的假名 有人知道这种技术吗 我今天才知道日语的“字母表”基本上是一个10x5的网格。10列(空+9个辅音)和5行(元音) 每个元素称为“假名”,语言由这些假名的序列组成;这些是基本的构件 这肯定会对语音识别算法产生很大影响 对于西方语言,我所知道的所有商业语音识别引擎都是基

我想找到一些开源代码(虽然我会满足于封闭源代码产品)来转换传入的日语假名音频流(即辅音+元音对),并实时打印出来

然而,我想使用这些基本的声音单位来定制自己的目的,所以我不希望任何试图提取真正日语单词的高级处理。我只想得到原始的假名

有人知道这种技术吗

我今天才知道日语的“字母表”基本上是一个10x5的网格。10列(空+9个辅音)和5行(元音)

每个元素称为“假名”,语言由这些假名的序列组成;这些是基本的构件

这肯定会对语音识别算法产生很大影响

对于西方语言,我所知道的所有商业语音识别引擎都是基于三元模型的:它用唯一的MFCC向量表示三个音素之间的每一个移动,并计算出一个语音最可能的三元序列(从中,它可以推断出微不足道的音素,然后浏览三胞胎词典,找出最可能的句子)

但是对于像日语这样的语言,我想这可能不再是最有效的算法了

相反,尝试捕捉每个单独的假名或假名对可能是有意义的

…可能是2克或4克,但不是3克


有什么东西吗?或者他们只是使用西方世界使用的相同引擎吗?

朱利叶斯有日语的声学和语言模型。 试一试,看看它是否适合你的应用

我不知道他们训练了语言模型,但是朱利叶斯可以支持任何顺序的n-gram 反向传球。在向前传球时,它支持双字符。在反向传球时通常使用4-gram 通过。使用Julius工具将两个LM组合在一起

路易斯 ASR实验室