Python 医院候诊时间的情绪分析_Python_Machine Learning_Nlp_Unsupervised Learning

Python 医院候诊时间的情绪分析

python machine-learning nlp

Python 医院候诊时间的情绪分析,python,machine-learning,nlp,unsupervised-learning,Python,Machine Learning,Nlp,Unsupervised Learning,我一直试图从医院里病人的回顾中推断出一个及时性得分（一个基于病人等待时间的得分）。可用的数据是患者的评论和他们对总体体验的评分。问题是我没有为患者的及时性评分贴标签，而是对整个体验的评分。像“我等待了很长时间，但体验是值得的”这样的评论具有良好的背景和良好的评级，应该会返回一个有点糟糕的及时性得分，同样的事情是“等待时间很短，但它不能证明糟糕的服务是合理的”。因此，撰写评论的人的背景/感受也很重要。我已经清理了评论，并选取了与等待时间（如果存在）相关的部分句子，并使用TextBlob或Vad

我一直试图从医院里病人的回顾中推断出一个及时性得分（一个基于病人等待时间的得分）。可用的数据是患者的评论和他们对总体体验的评分。问题是我没有为患者的及时性评分贴标签，而是对整个体验的评分。像“我等待了很长时间，但体验是值得的”这样的评论具有良好的背景和良好的评级，应该会返回一个有点糟糕的及时性得分，同样的事情是“等待时间很短，但它不能证明糟糕的服务是合理的”。因此，撰写评论的人的背景/感受也很重要。我已经清理了评论，并选取了与等待时间（如果存在）相关的部分句子，并使用TextBlob或VaderTouction等库来推断患者的情绪是否积极。问题是，我有20%的案例从不同的图书馆得到了不同的结果，但它们并不总是最有意义（等待时间长但在良好环境下的评论会返回良好的等待时间，但至少应该是中性的）。

我需要某种方法，将句子的上下文和实际评分与他们花在等待上的时间关联起来，并得出分数，这是一种情感分析，考虑到整个句子，但寻找谈论等待时间的特定上下文。

你的问题被称为“基于方面的情绪分析”。我不是这方面的专家，但也许这个博客可以让你开始-

一个有用的解决方案是：

在给定语料库中应用语义角色标签，以查找突出显示的特征

使用单词嵌入技术，如带有负采样的Word2Vec SkipGram

（想法：相同的单词出现在相同的上下文中，所以它不需要重新计算相似性。）

通过包围的单词（窗口大小）查找特征的情感

注意：使用情感词典，如SentiWordNet可能会有所帮助你

定义一种方法以获得整体方面级别（突出显示的特征）情绪分析

例如，在二进制分类中：
pos/neg极性的聚合可划分为句子中的特征数量

训练你的模特