Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/android/206.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Android studio-字母表语音识别_Android_Speech Recognition_Speech To Text_Android Studio 3.0_Voice Recognition - Fatal编程技术网

Android studio-字母表语音识别

Android studio-字母表语音识别,android,speech-recognition,speech-to-text,android-studio-3.0,voice-recognition,Android,Speech Recognition,Speech To Text,Android Studio 3.0,Voice Recognition,我正在为论文开发一个语音识别应用程序,可以识别字母表中的字母。我设法做到了从语音到文本的再识别,但我不知道如何才能做到只识别字母而不识别单词。比如,如果我说“A”,应用程序应该显示字母A的图片。你们能帮我吗。 下面是我在youtube帮助下的语音识别应用程序的示例代码,我通过比较字符串“apple”和语音文本识别来实现 final SpeechRecognizer mSpeechRecognizer = SpeechRecognizer.createSpeechRecognizer(this);

我正在为论文开发一个语音识别应用程序,可以识别字母表中的字母。我设法做到了从语音到文本的再识别,但我不知道如何才能做到只识别字母而不识别单词。比如,如果我说“A”,应用程序应该显示字母A的图片。你们能帮我吗。 下面是我在youtube帮助下的语音识别应用程序的示例代码,我通过比较字符串“apple”和语音文本识别来实现

final SpeechRecognizer mSpeechRecognizer = SpeechRecognizer.createSpeechRecognizer(this);

    final Intent mSpeechRecognizerIntent = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH);
    mSpeechRecognizerIntent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL,
            RecognizerIntent.LANGUAGE_MODEL_FREE_FORM);
    mSpeechRecognizerIntent.putExtra(RecognizerIntent.EXTRA_LANGUAGE,
            Locale.getDefault());

    Bundle bundle = getIntent().getExtras();
    if (bundle != null) {
        textview.setText(bundle.getString("letterA"));
        if (textview.getText().toString().equalsIgnoreCase("apple")){
            q="apple";
            Glide.with(Voice_view.this).load(R.drawable.apple).into(imageView);
            letter.setText("A");

一般来说,识别A、B、C的问题。。。字母表中的字母有两个维度,首先是少量的音频数据,其次是一些字母听起来相似的趋势。我们可以在很短的时间内说“A”,这导致与准确检测所需的音频数据相比,音频数据非常少。“b,c,d,e,g…”都以“iy”的声音结束,所以我们要继续分离它们,只需要在开始时有一个非常短的音频闪光。解码者通常更喜欢“A”,因为我们倾向于在发音时把它拖出来

在某些识别上下文中,如果您可以访问上下文无关语法来缩小可以识别为有效句子的范围,那么您可以获得很大的控制权。在线识别器不会给你这个选项(据我所知)。像Julius这样的独立识别器可以使用Backus-Naur形式的上下文无关语法,这样虽然没有解决问题,但命中单个字母的几率会大大提高