Python 数字的特定格式是匹配的

Python 数字的特定格式是匹配的,python,rasa-nlu,Python,Rasa Nlu,Rasa NLU版本:0.12.3 操作系统(windows、osx等):Ubuntu 18.04 模型配置文件的内容: language: "en" pipeline: - name: "intent_featurizer_count_vectors" - name: "intent_classifier_tensorflow_embedding" intent_tokenization_flag: true intent_split_symbol: "_" 问题: langua

Rasa NLU版本:0.12.3

操作系统(windows、osx等):Ubuntu 18.04

模型配置文件的内容:

language: "en"


pipeline:
- name: "intent_featurizer_count_vectors"
- name: "intent_classifier_tensorflow_embedding"
  intent_tokenization_flag: true
  intent_split_symbol: "_"
问题:

language: "en"


pipeline:
- name: "intent_featurizer_count_vectors"
- name: "intent_classifier_tensorflow_embedding"
  intent_tokenization_flag: true
  intent_split_symbol: "_"
我的意向培训数据包含在以下数据中

{{firstName | limito:7}{{firstName.length>7?'…':''}


一旦在测试过程中对数据进行了培训,该意图将与输入相匹配20/7/2018

有一个典型的问题,了解类似问题的答案会很有用:

  • 你有多少训练数据
  • 你有多少打算
  • 意图有多相似
但我认为在你的情况下,有两件事(至少)对你不利:

  • 您使用的特征化器将数字集在一起。请参见代码中的此注释:

    使用sklearn的“CountVectorizer”创建意图特征的文字包表示。所有仅由数字组成的令牌(例如123和99,但不是ab12d)将由单个功能表示。“

  • 标记器或多或少基于空格:

    “令牌\u模式”:r'(?u)\b\w\w+\b'

还请记住,Rasa NLU始终会选择一个意图。因此,您也应该监控信心。也许输入的信心足够低,您可以添加一个阈值以回退到某种固定的响应


你能为两个给定的例子提供预期的意图和实体吗?

我预期的是回退意图,因为我已经训练了某种模式。我得到的置信度分数是0.91,这根本不是Rasa NLU的工作方式,或者说一般来说是基于ML的自然语言处理。你可以用真实的全文示例和算法来训练它rithm决定模式本身。此外,Rasa不实施回退,您必须自己实施。是的,我以默认的意图名称实施了回退。但我不知道该意图格式如何以及为什么与格式11 55 220或20/07/2018的输入匹配