Ibm cloud IBM Watson语音文本转换中转录本和备选方案之间的不一致性

Ibm cloud IBM Watson语音文本转换中转录本和备选方案之间的不一致性,ibm-cloud,speech-recognition,ibm-watson,speech-to-text,Ibm Cloud,Speech Recognition,Ibm Watson,Speech To Text,IBM Watson的Speech to Text API中似乎存在一个长期存在的问题,即转录本和备选方案不一致。例如,一份令人反感的抄本摘录如下: 'fall being just like' 通过时间戳聚合的相应备选方案如下 [following, vaulting, fall, faulting, folding] [like] 表示没有与“存在”或“公正”相对应的备选方案。我见过的最令人震惊的例子是一个抄本很好,但备选方案是空的案例。我正在开发的应用程序假设备选方案在很大程度上是成绩

IBM Watson的Speech to Text API中似乎存在一个长期存在的问题,即转录本和备选方案不一致。例如,一份令人反感的抄本摘录如下:

'fall being just like'
通过时间戳聚合的相应备选方案如下

[following, vaulting, fall, faulting, folding]
[like]
表示没有与“存在”或“公正”相对应的备选方案。我见过的最令人震惊的例子是一个抄本很好,但备选方案是空的案例。我正在开发的应用程序假设备选方案在很大程度上是成绩单的超集(直到考虑智能格式),因此这对我来说是一个严重的问题

另一个摘录是:

'are a team you know 80 - around back great' 
但是备选方案[是,我们的,全部]在6.19和6.39之间,然后[返回]在8.18和8.54之间,这给了约2秒的未解释暂停,其中转录本能够检测到单词,但备选方案没有

有时,当备选方案中的词语无法与转录本中出现的词语相匹配时,似乎也会出现相反的情况,这使问题更加复杂,因为我甚至无法强制协调两者,例如,通过在备选方案中插入带有占位符时间戳的词语

长话短说:为什么有时即使在忽略了智能格式的影响后,成绩单和备选方案也无法协调?特别是,成绩单可能包含备选方案中未出现的词语,反之亦然