Ibm cloud 沃森文字语音转换罗马数字在pt BR中最多只能识别XXXIX(39)

Ibm cloud 沃森文字语音转换罗马数字在pt BR中最多只能识别XXXIX(39),ibm-cloud,text-to-speech,watson,Ibm Cloud,Text To Speech,Watson,在用葡萄牙语合成一本书的某些部分(pt BR)时,我注意到,如果数字超过XXIX(39),则包含罗马数字的章节名称不会被识别为数字 像数字L(50)或LX(60)一样,不会被正确地合成为一个数字,它将被解读为字母。使用“say as”SSMLS标记不会导致任何更改 这是预期的吗?是否有任何可能的解决办法 这是预期的吗 我想,是的,开发人员通常很懒得实现一个通用的解决方案 是否有任何可能的解决办法 自己预处理文本并将数字转换为文字 这是预期的吗 我想,是的,开发人员通常很懒得实现一个通用的解决方案

在用葡萄牙语合成一本书的某些部分(pt BR)时,我注意到,如果数字超过XXIX(39),则包含罗马数字的章节名称不会被识别为数字

像数字L(50)或LX(60)一样,不会被正确地合成为一个数字,它将被解读为字母。使用“say as”SSMLS标记不会导致任何更改

这是预期的吗?是否有任何可能的解决办法

这是预期的吗

我想,是的,开发人员通常很懒得实现一个通用的解决方案

是否有任何可能的解决办法

自己预处理文本并将数字转换为文字

这是预期的吗

我想,是的,开发人员通常很懒得实现一个通用的解决方案

是否有任何可能的解决办法


自己预处理文本并将数字转换为文字。

另一个选项是自定义模型,如中所述

下面是一个简单的例子

使用此命令创建自定义模型

curl -X POST -u ***:*** --header "Content-Type: application/json" --data "{\"name\":\"cURL Test\",\"language\":\"en-US\", \"description\":\"Customization test via cURL\"}" "https://stream.watsonplatform.net/text-to-speech/api/v1/customizations"
上述命令将返回自定义id(在这种情况下,e250e7ee-fbec-47e8-a1b8-59435c1b18e3

然后使用此命令添加翻译

curl -X PUT -u ***:*** --header "Content-Type: application/json" --data "{\"translation\":\"thirty\"}" "https://stream.watsonplatform.net/text-to-speech/api/v1/customizations/e250e7ee-fbec-47e8-a1b8-59435c1b18e3/words/XXX"
最后,试试看

curl -X GET -u ***:*** --header "Accept: audio/wav" --output xxx.wav "https://stream.watsonplatform.net/text-to-speech/api/v1/synthesize?text=chapter%20XXX&customization_id=e250e7ee-fbec-47e8-a1b8-59435c1b18e3"
它将生成一个音频文件,上面写着“第三十章”


另外,对于PT-BR,请参见,以便您可以使用选项“语言”并将XXX翻译为“trinta”

另一个选项是自定义您的模型,如中所述

下面是一个简单的例子

使用此命令创建自定义模型

curl -X POST -u ***:*** --header "Content-Type: application/json" --data "{\"name\":\"cURL Test\",\"language\":\"en-US\", \"description\":\"Customization test via cURL\"}" "https://stream.watsonplatform.net/text-to-speech/api/v1/customizations"
上述命令将返回自定义id(在这种情况下,e250e7ee-fbec-47e8-a1b8-59435c1b18e3

然后使用此命令添加翻译

curl -X PUT -u ***:*** --header "Content-Type: application/json" --data "{\"translation\":\"thirty\"}" "https://stream.watsonplatform.net/text-to-speech/api/v1/customizations/e250e7ee-fbec-47e8-a1b8-59435c1b18e3/words/XXX"
最后,试试看

curl -X GET -u ***:*** --header "Accept: audio/wav" --output xxx.wav "https://stream.watsonplatform.net/text-to-speech/api/v1/synthesize?text=chapter%20XXX&customization_id=e250e7ee-fbec-47e8-a1b8-59435c1b18e3"
它将生成一个音频文件,上面写着“第三十章”

另外,对于PT-BR,请参见,以便您可以使用“语言”选项并将XXX翻译为“trinta”