Android 语音识别:单词之间的间隙
我有一个简单的语音识别应用程序,可以打印所有可能解码的字符串ArrayList。问题是,只有在我不在字里行间停下来/停顿的情况下,它才会起作用。如果我有一个轻微的停顿(非常短,就像我正常说话一样),应用程序就会停止。我查看了参数SPEECH\u INPUT\u COMPLETE\u SILENCE\u LENGTH\u MILLIS,但它没有改变任何东西 有语音识别专家的线索吗 这是我的密码:Android 语音识别:单词之间的间隙,android,voice-recognition,Android,Voice Recognition,我有一个简单的语音识别应用程序,可以打印所有可能解码的字符串ArrayList。问题是,只有在我不在字里行间停下来/停顿的情况下,它才会起作用。如果我有一个轻微的停顿(非常短,就像我正常说话一样),应用程序就会停止。我查看了参数SPEECH\u INPUT\u COMPLETE\u SILENCE\u LENGTH\u MILLIS,但它没有改变任何东西 有语音识别专家的线索吗 这是我的密码: package com.bernard.vtt; import android.app.Activi
package com.bernard.vtt;
import android.app.Activity;
import android.content.Intent;
import android.os.Bundle;
import android.speech.RecognitionListener;
import android.speech.RecognizerIntent;
import android.speech.SpeechRecognizer;
import android.view.View;
import android.widget.Button;
import android.widget.TextView;
import java.util.ArrayList;
public class MainActivity extends Activity implements RecognitionListener {
private TextView mText;
SpeechRecognizer speech = null;
private Intent recognizerIntent;
@Override
public void onCreate(Bundle savedInstanceState)
{
super.onCreate(savedInstanceState);
setContentView(R.layout.activity_main);
Button speakButton = (Button) findViewById(R.id.btn);
mText = (TextView) findViewById(R.id.textView1);
speech = SpeechRecognizer.createSpeechRecognizer(this);
speech.setRecognitionListener(this);
recognizerIntent = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH);
recognizerIntent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_PREFERENCE,
"en");
recognizerIntent.putExtra(RecognizerIntent.EXTRA_CALLING_PACKAGE,
this.getPackageName());
recognizerIntent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL,
RecognizerIntent.LANGUAGE_MODEL_WEB_SEARCH);
recognizerIntent.putExtra(RecognizerIntent.EXTRA_MAX_RESULTS, 3);
speakButton.setOnClickListener(new View.OnClickListener() {
@Override
public void onClick(View view) {
speech.startListening(recognizerIntent);
}
});
}
@Override
public void onResults(Bundle results) {
ArrayList<String> matches = results
.getStringArrayList(SpeechRecognizer.RESULTS_RECOGNITION);
String text = "";
assert matches != null;
for (String result : matches)
text += result + "\n";
mText.setText(text);
speech.stopListening();
}
@Override
public void onReadyForSpeech(Bundle params) {
}
@Override
public void onBeginningOfSpeech() {
}
@Override
public void onRmsChanged(float rmsdB) {
}
@Override
public void onBufferReceived(byte[] buffer) {
}
@Override
public void onEndOfSpeech() {
}
@Override
public void onError(int error) {
}
@Override
public void onPartialResults(Bundle partialResults) {
}
@Override
public void onEvent(int eventType, Bundle params) {
}
package com.bernard.vtt;
导入android.app.Activity;
导入android.content.Intent;
导入android.os.Bundle;
导入android.speech.RecognitionListener;
导入android.speech.RecognizerIntent;
导入android.SpeechRecognizer;
导入android.view.view;
导入android.widget.Button;
导入android.widget.TextView;
导入java.util.ArrayList;
公共类MainActivity扩展活动实现了RecognitionListener{
私有文本查看多行文本;
SpeechRecognizer speech=null;
私人意图识别人意图;
@凌驾
创建时的公共void(Bundle savedInstanceState)
{
super.onCreate(savedInstanceState);
setContentView(R.layout.activity_main);
按钮speakButton=(按钮)findViewById(R.id.btn);
mText=(TextView)findViewById(R.id.textView1);
SpeechRecognizer.createSpeechRecognizer(此);
speech.setRecognitionListener(此);
recognizerIntent=新意图(recognizerIntent.ACTION\u recognizer\u SPEECH);
recognizerIntent.putExtra(recognizerIntent.EXTRA_语言_首选项,
“en”);
recognizerIntent.putExtra(recognizerIntent.EXTRA_调用_包,
这个.getPackageName());
recognizerIntent.putExtra(recognizerIntent.EXTRA_语言_模型,
识别者意图、语言、模型、网络搜索);
recognizerIntent.putExtra(recognizerIntent.EXTRA_最大_结果,3);
setOnClickListener(新视图.OnClickListener(){
@凌驾
公共void onClick(视图){
演讲。听讲(识别意图);
}
});
}
@凌驾
公共结果(捆绑结果){
ArrayList匹配=结果
.getStringArrayList(SpeechRecognitor.RESULTS_RECOGNITION);
字符串文本=”;
断言匹配!=null;
for(字符串结果:匹配项)
文本+=结果+“\n”;
mText.setText(text);
停止听;
}
@凌驾
ReadyForSpeech上的公共void(Bundle参数){
}
@凌驾
开始时的公共无效fSpeech(){
}
@凌驾
在RMSCHANGED上的公共无效(浮动rmsdB){
}
@凌驾
已接收公共无效onBufferReceived(字节[]缓冲区){
}
@凌驾
公共无效onEndOfSpeech(){
}
@凌驾
公共无效onError(内部错误){
}
@凌驾
public void onPartialResults(Bundle partialResults){
}
@凌驾
public void onEvent(int eventType,Bundle参数){
}
我相信内置语音识别不会持续运行。它旨在听到一个语音输入并给出结果。如果你想持续收听,你需要在每次onResults回调时重新启动识别。我还相信语音输入\u COMPLETE\u SILENCE\u LENGTH\u MILLIS
有一个最大值,这就是为什么更改它会有l小效果。我相信内置语音识别不会持续运行。它旨在听到一个语音输入并给出结果。如果你想持续收听,你需要在每次onResults回调时重新启动识别。我还相信语音输入\u完全\u静音\u长度\u毫秒
有一个最大值,这就是为什么changing它几乎没有效果。我怀疑它是这样设计的,因为我使用startactivity方法进行了相同的测试,得到了相同的结果。我明天会尝试,但我觉得这样做是一种变通方法。我希望看到更多关于我问题的回答。@narb直接来自:“此API的实现可能会将音频流传输到远程服务器以执行语音识别。因此,此API不用于连续识别,这将消耗大量电池和带宽。"@ NANB进一步扩展,以继续对Android进行识别,您可能需要使用第三方产品,如NueN.我们试图使SpeechRecognizer继续进行识别,因为您在这里寻找,但最终必须与第三方进行合作。您也可以考虑您的需要。谢谢!我会看看它:)我HAVe有些人怀疑它是这样设计的,因为我使用startactivity方法实施了相同的测试,得到了相同的结果。我明天会尝试,但我觉得这样做是一种变通方法。我希望看到更多关于我问题的回答。@narb直接来自:“此API的实现可能会将音频流传输到远程服务器以执行语音识别。因此,此API不用于连续识别,这将消耗大量电池和带宽。"@ NANB进一步扩展,以继续对Android进行识别,您可能需要使用第三方产品,如NueN.我们试图使SpeechRecognizer连续进行识别,因为您在这里寻找,但最终必须与第三方进行合作。您也可以考虑您的需要。谢谢!我会看看它:)POSII不可复制的可能复制的