NLP-从指令列表中提取动作动词、名词

NLP-从指令列表中提取动作动词、名词,nlp,Nlp,我正在寻找一些如何实现我的想法的方向。 我会有一份包含配料名称、设备清单和烹饪方法的食谱。我想做的是将烹饪方法简化为动作动词、配料名称和设备名称 例如: 配料:鸡蛋、胡椒、盐 设备:水壶 方法:1。把鸡蛋打进罐子里。 加入胡椒粉和盐 输出将存储在列表中。 产出:1。炸裂、鸡蛋、罐子 2.加入胡椒粉、胡椒粉、罐子 3.Add、salt、jug使用NLP,您可以将整个文本标记为词性。在标记整个文本后,您知道成分和设备总是名词,“动作动词”是动词。现在你可以把你的问题分成三部分 你如何区分设备

我正在寻找一些如何实现我的想法的方向。 我会有一份包含配料名称、设备清单和烹饪方法的食谱。我想做的是将烹饪方法简化为动作动词、配料名称和设备名称

  • 例如:
  • 配料:鸡蛋、胡椒、盐
  • 设备:水壶
  • 方法:1。把鸡蛋打进罐子里。
  • 加入胡椒粉和盐
输出将存储在列表中。 产出:1。炸裂、鸡蛋、罐子 2.加入胡椒粉、胡椒粉、罐子
3.Add、salt、jug

使用NLP,您可以将整个文本标记为词性。在标记整个文本后,您知道
成分
设备
总是名词,“动作动词”是动词。现在你可以把你的问题分成三部分

  • 你如何区分设备和配料
  • 检测哪些动词是“动作动词”并且与您的问题域相关,例如“添加、混合、剪切…”
  • 创造句型。[动作动词][成分][设备]
  • 1中,您可以使用所有名词,并使用
    词频创建“设备和配料包单词”。这种技术背后的基本原理是,这些词更可能被频繁使用,因为它们是问题域的一部分。然后,为了区分彼此,可以使用数据挖掘,例如亲和性分析

    2中,您可以解析一组食谱,提取所有动词,并获取最常用的动词。创建一个“动词袋”,并使用词干将它们放在不定式或基本形式中。例如,“切割”和“切割”应与“切割”相同。有了这个种子(你的动词包),你可以在你的食谱中使用regex after来扫描这些动词

    3中,你需要找到一个句型。也许你会发现不止一个

    这是一个很好的起点,应该会给你一些想法。将NLP与数据挖掘/机器学习结合起来,可以更深入地了解您的数据