Python 数字的特定格式是匹配的_Python_Rasa Nlu

Python 数字的特定格式是匹配的

python

Python 数字的特定格式是匹配的,python,rasa-nlu,Python,Rasa Nlu,Rasa NLU版本：0.12.3 操作系统（windows、osx等）：Ubuntu 18.04 模型配置文件的内容： language: "en" pipeline: - name: "intent_featurizer_count_vectors" - name: "intent_classifier_tensorflow_embedding" intent_tokenization_flag: true intent_split_symbol: "_" 问题： langua

Rasa NLU版本：0.12.3

操作系统（windows、osx等）：Ubuntu 18.04

模型配置文件的内容：

language: "en"


pipeline:
- name: "intent_featurizer_count_vectors"
- name: "intent_classifier_tensorflow_embedding"
  intent_tokenization_flag: true
  intent_split_symbol: "_"

问题：

language: "en"


pipeline:
- name: "intent_featurizer_count_vectors"
- name: "intent_classifier_tensorflow_embedding"
  intent_tokenization_flag: true
  intent_split_symbol: "_"

我的意向培训数据包含在以下数据中

{{firstName | limito:7}{{firstName.length>7？'…'：''}

一旦在测试过程中对数据进行了培训，该意图将与输入相匹配20/7/2018

有一个典型的问题，了解类似问题的答案会很有用：

你有多少训练数据
你有多少打算
意图有多相似

但我认为在你的情况下，有两件事（至少）对你不利：

您使用的特征化器将数字集在一起。请参见代码中的此注释：

使用sklearn的“CountVectorizer”创建意图特征的文字包表示。所有仅由数字组成的令牌（例如123和99，但不是ab12d）将由单个功能表示。“

标记器或多或少基于空格：

“令牌\u模式”：r'（？u）\b\w\w+\b'

还请记住，Rasa NLU始终会选择一个意图。因此，您也应该监控信心。也许输入的信心足够低，您可以添加一个阈值以回退到某种固定的响应

你能为两个给定的例子提供预期的意图和实体吗？

我预期的是回退意图，因为我已经训练了某种模式。我得到的置信度分数是0.91，这根本不是Rasa NLU的工作方式，或者说一般来说是基于ML的自然语言处理。你可以用真实的全文示例和算法来训练它rithm决定模式本身。此外，Rasa不实施回退，您必须自己实施。是的，我以默认的意图名称实施了回退。但我不知道该意图格式如何以及为什么与格式11 55 220或20/07/2018的输入匹配