C# 是否可以过滤“;感叹词/&引用;“哼唱”;在MS语音到文本中?

C# 是否可以过滤“;感叹词/&引用;“哼唱”;在MS语音到文本中?,c#,speech-recognition,microsoft-cognitive,C#,Speech Recognition,Microsoft Cognitive,我们正在试验使用微软语音到文本(特别是使用C#API)转录视频材料。我们从微软得到的结果通常包含很多“感叹词”/“嗡嗡声”(这里不确定正确的术语),如“hmm”、“uhm”等,而其他提供商似乎会自动过滤掉这些内容。在某些情况下,将这些内容包括在结果中可能是有意义的,但在其他设置中,如果有办法配置SpeechRecognitor以排除这些内容,那就更好了。有没有办法做到这一点?我们的后端引擎具有这种能力。 但是,目前还没有公开的文档记录,我不确定您将如何将此选择从客户端发送到服务。目前,它是一些端

我们正在试验使用微软语音到文本(特别是使用C#API)转录视频材料。我们从微软得到的结果通常包含很多“感叹词”/“嗡嗡声”(这里不确定正确的术语),如“hmm”、“uhm”等,而其他提供商似乎会自动过滤掉这些内容。在某些情况下,将这些内容包括在结果中可能是有意义的,但在其他设置中,如果有办法配置SpeechRecognitor以排除这些内容,那就更好了。有没有办法做到这一点?

我们的后端引擎具有这种能力。 但是,目前还没有公开的文档记录,我不确定您将如何将此选择从客户端发送到服务。目前,它是一些端点的默认设置,而不是其他端点的默认设置(“互联网搜索”与“口述”)

我将不得不与我们的一位服务工程师交谈,看看是否有可能从客户那里动态地改变这一点,并以更好的响应返回给您

谢谢

布莱恩

---更新---

我和我们的一位服务工程师谈过,这个功能叫做TrueText格式化。我在我们的测试和文档中做了一些挖掘,实际上在这里公开了文档

如何在SpeechConfig对象上调用/设置它的示例如下

        var trueText = "TrueText";
        myDefaultConfig.SetProperty(PropertyId.SpeechServiceResponse_PostProcessingOption, trueText);

文档目前没有显示其他状态,我认为是“正常”而不是“TrueText”。本周我将尝试自己抽出时间来尝试一下,并改进有关此属性id的文档。

在埋没在其他东西中一段时间后,再次查看此文档。我们尝试使用TrueText选项,但结果是所有格式都被删除,但“嗡嗡声”仍然存在。现在使用Microsoft.CognitiveServices.Speech 1.12.0再次测试,但结果相同。还有其他人在为同样的问题挣扎吗?(我们主要使用挪威语剪辑进行测试,因为这与我们的用例最相关,以防产生影响…)