Nlp 如何在LUIS中的列表实体中使用独立于语言的规范形式?

Nlp 如何在LUIS中的列表实体中使用独立于语言的规范形式?,nlp,azure-language-understanding,nlu,Nlp,Azure Language Understanding,Nlu,在LUIS中使用封闭列表实体时,始终存在规范形式和可选的多个同义词 在下面的例子中,有标准形式“绿色”和一个可能的同义词“橄榄” 当用户说“olive”时,前端软件不必关心“olive”,而是从LUIS那里得到“绿色”的分辨率 但由于语言可能会发生变化,前端软件应该是独立于语言的,因此我实际上希望从API中获得的不是英语术语“绿色”,而是一个独立于语言的绿色标识符字符串,如“my_chatbot_green_id” 是否建议使用标识符作为canocial形式,并添加“green”作为同义词?我想

在LUIS中使用封闭列表实体时,始终存在规范形式和可选的多个同义词

在下面的例子中,有标准形式“绿色”和一个可能的同义词“橄榄”

当用户说“olive”时,前端软件不必关心“olive”,而是从LUIS那里得到“绿色”的分辨率

但由于语言可能会发生变化,前端软件应该是独立于语言的,因此我实际上希望从API中获得的不是英语术语“绿色”,而是一个独立于语言的绿色标识符字符串,如“my_chatbot_green_id”

是否建议使用标识符作为canocial形式,并添加“green”作为同义词?我想不是。那么,有没有其他方法来实现与语言无关的标识符

原始示例

  "closedLists": [
    {
      "name": "ColorListEntity",
      "subLists": [
        {
          "canonicalForm": "green",
          "list": [
            "olive"
          ]
        },
        {
          "canonicalForm": "blue",
          "list": [
            "azure"
          ]
        }
      ],
这有意义吗?

  "closedLists": [
    {
      "name": "ColorListEntity",
      "subLists": [
        {
          "canonicalForm": "my_chatbot_green_id",
          "list": [
            "olive",
            "green"
          ]
        },
        {
          "canonicalForm": "my_chatbot_blue_id",
          "list": [
            "blue",
            "azure"
          ]
        }
      ],

您应该为每种颜色使用一个通用标识符,并根据需要向列表中添加多语言同义词。

因此,这与“这有意义吗?”下的建议相同?使用标识符作为规范形式?希望它不会混淆nlu?是的,它不会影响nlu。添加到列表中的所有颜色都提取为cannonical形式。