Nlp 将自由文本语句与预定义属性关联

Nlp 将自由文本语句与预定义属性关联,nlp,Nlp,我有一份人们关心的几十种产品属性的清单,比如 融资 制造质量 耐久性 销售经验 还有数百万来自客户的关于该产品的免费文本声明,例如 “融资很容易,但住房很脆弱。” 我想根据每个自由文本语句与每个属性的关联程度,以及它们之间的关联是积极的还是消极的,来给每个自由文本语句打分 在给定的示例中,与融资有强烈的正相关,与制造质量有强烈的负相关 感觉这类问题可能是自然语言编程(NLP)的领域。然而,我花了几个小时阅读像OpenNLP和NLTK这样的东西,发现有太多特定于领域的术语,我无法找出解决这个特

我有一份人们关心的几十种产品属性的清单,比如

  • 融资
  • 制造质量
  • 耐久性
  • 销售经验
还有数百万来自客户的关于该产品的免费文本声明,例如

“融资很容易,但住房很脆弱。”

我想根据每个自由文本语句与每个属性的关联程度,以及它们之间的关联是积极的还是消极的,来给每个自由文本语句打分

在给定的示例中,与
融资
有强烈的正相关,与
制造质量
有强烈的负相关

感觉这类问题可能是自然语言编程(NLP)的领域。然而,我花了几个小时阅读像OpenNLP和NLTK这样的东西,发现有太多特定于领域的术语,我无法找出解决这个特定问题的重点

我的问题分为三个部分:

  • NLP是解决这类问题的正确途径吗
  • 对于这个具体问题,我应该关注NLP的哪些方面
  • 有没有我没有考虑过的替代方案

    • 是的,这是一个名为的NLP问题。情绪分析是一个非常活跃的研究领域,有着不同的方法,而且很多其他NLP方法都需要协同工作,因此它肯定不是NLP中最容易开始的领域


      关于该领域学术研究的最新调查可以在中找到。

      是的,这是一个名为的NLP问题。情绪分析是一个非常活跃的研究领域,有着不同的方法,而且很多其他NLP方法都需要协同工作,因此它肯定不是NLP中最容易开始的领域


      有关该领域学术研究的最新调查可以在中找到。

      您可能会发现一个有用的资源是SentiWordNet。(http://sentiwordnet.isti.cnr.it/)这就像一本字典,对单词有情感等级。它会告诉你,它认为一个词在多大程度上是积极的、消极的或客观的

      然后,您可以将其与一些nltk代码结合起来,这些代码会在您的句子中查找您希望将情绪与之关联的单词。因此,你可以编写一个脚本来获得一些有意义的文本块,这些文本块围绕着你所看到的单词,可能是句子或从句。然后你可以用另一个东西来浏览周围的单词,并从SentiWordNet中获取所有的情感分数


      我有一些老代码可以做到这一点,如果您愿意,可以放在github上,但您仍然需要自己请求SentiWordNet

      SentiWordNet是您可能会找到的一个有用的资源。(http://sentiwordnet.isti.cnr.it/)这就像一本字典,对单词有情感等级。它会告诉你,它认为一个词在多大程度上是积极的、消极的或客观的

      然后,您可以将其与一些nltk代码结合起来,这些代码会在您的句子中查找您希望将情绪与之关联的单词。因此,你可以编写一个脚本来获得一些有意义的文本块,这些文本块围绕着你所看到的单词,可能是句子或从句。然后你可以用另一个东西来浏览周围的单词,并从SentiWordNet中获取所有的情感分数


      我有一些老代码可以做到这一点,如果您愿意,可以放在github上,但您仍然需要自己请求SentiWordNet

      我想你的问题更多的是联想,而不仅仅是分类。现在,我们继续这个假设:

      NLP是解决这类问题的正确途径吗?

      对于这个特定问题,我应该重点学习NLP的哪些方面?

      • 词性标注
      • 情绪分析
      有没有我没有考虑过的替代方案?


      深入研究有关NLP的自动机理论将对您有很大帮助,它帮助我掌握OpenNLP等实现。

      我想您的问题更多地是关联,而不仅仅是分类。现在,我们继续这个假设:

      NLP是解决这类问题的正确途径吗?

      对于这个特定问题,我应该重点学习NLP的哪些方面?

      • 词性标注
      • 情绪分析
      有没有我没有考虑过的替代方案?


      深入研究有关NLP的自动机理论将对您有很大帮助,它对我掌握OpenNLP等实现有很大帮助。

      您是否打算发布此链接以获取最大熵?是的,这一个更具体。我想首先,我最初分享的那个,可以提供一些数学背景。那么事情解决了吗?你打算发布这个关于最大熵的链接吗?是的,这一个更具体。我想首先,我最初分享的那个,可以提供一些数学背景。那么事情解决了吗?