Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/341.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 医院候诊时间的情绪分析_Python_Machine Learning_Nlp_Unsupervised Learning - Fatal编程技术网

Python 医院候诊时间的情绪分析

Python 医院候诊时间的情绪分析,python,machine-learning,nlp,unsupervised-learning,Python,Machine Learning,Nlp,Unsupervised Learning,我一直试图从医院里病人的回顾中推断出一个及时性得分(一个基于病人等待时间的得分)。可用的数据是患者的评论和他们对总体体验的评分。问题是我没有为患者的及时性评分贴标签,而是对整个体验的评分。 像“我等待了很长时间,但体验是值得的”这样的评论具有良好的背景和良好的评级,应该会返回一个有点糟糕的及时性得分,同样的事情是“等待时间很短,但它不能证明糟糕的服务是合理的”。因此,撰写评论的人的背景/感受也很重要。 我已经清理了评论,并选取了与等待时间(如果存在)相关的部分句子,并使用TextBlob或Vad

我一直试图从医院里病人的回顾中推断出一个及时性得分(一个基于病人等待时间的得分)。可用的数据是患者的评论和他们对总体体验的评分。问题是我没有为患者的及时性评分贴标签,而是对整个体验的评分。 像“我等待了很长时间,但体验是值得的”这样的评论具有良好的背景和良好的评级,应该会返回一个有点糟糕的及时性得分,同样的事情是“等待时间很短,但它不能证明糟糕的服务是合理的”。因此,撰写评论的人的背景/感受也很重要。 我已经清理了评论,并选取了与等待时间(如果存在)相关的部分句子,并使用TextBlob或VaderTouction等库来推断患者的情绪是否积极。问题是,我有20%的案例从不同的图书馆得到了不同的结果,但它们并不总是最有意义(等待时间长但在良好环境下的评论会返回良好的等待时间,但至少应该是中性的)。
我需要某种方法,将句子的上下文和实际评分与他们花在等待上的时间关联起来,并得出分数,这是一种情感分析,考虑到整个句子,但寻找谈论等待时间的特定上下文。

你的问题被称为“基于方面的情绪分析”。我不是这方面的专家,但也许这个博客可以让你开始-

一个有用的解决方案是:

  • 在给定语料库中应用语义角色标签,以查找突出显示的特征
  • 使用单词嵌入技术,如带有负采样的Word2Vec SkipGram

    (想法:相同的单词出现在相同的上下文中,所以 它不需要重新计算相似性。)

  • 通过包围的单词(窗口大小)查找特征的情感

    注意:使用情感词典,如SentiWordNet可能会有所帮助 你

  • 定义一种方法以获得整体方面级别(突出显示的特征)情绪分析

    例如,在二进制分类中:
    pos/neg极性的聚合可划分为句子中的特征数量

  • 训练你的模特