Python 使用自然语言处理来拆分Bad&;员工调查的良好评价

Python 使用自然语言处理来拆分Bad&;员工调查的良好评价,python,nlp,nltk,Python,Nlp,Nltk,所以这里有点遥不可及,我为缺乏信息道歉。然而,我现在甚至都不知道该去哪里找 所以我试图从一个随机的公司对员工进行的虚假调查中,将好的和坏的评论分开。我所拥有的只是一个数据框架,由员工的评论和他们的经理ID代码组成。这样做的目的是尝试看看有多少好的和/或不好的评论通过他们的ID与经理关联 import pandas as pd trial_text=pd.read_csv("trial.csv") trial_text.head() ManagerCode Co

所以这里有点遥不可及,我为缺乏信息道歉。然而,我现在甚至都不知道该去哪里找

所以我试图从一个随机的公司对员工进行的虚假调查中,将好的和坏的评论分开。我所拥有的只是一个数据框架,由员工的评论和他们的经理ID代码组成。这样做的目的是尝试看看有多少好的和/或不好的评论通过他们的ID与经理关联

import pandas as pd 
trial_text=pd.read_csv("trial.csv")
trial_text.head()

   ManagerCode              Comment
0        AB123  Great place to work
1        AB123  Need more training
2        AB123  Hate working here
3        AB124  Always late home
4        AB124  Manager never listens
对于包含更多信息的数据集,我经常使用NLTK,因此基于NLTK的任何内容都不会成为问题。就像我说的,就我所拥有的,“谷歌”有太多的信息,我不知道从哪里开始(或者说是有用的)!如果有人能给我一个建议,让我走上正轨,那就太好了


谢谢

您需要情绪分析。我不认为你会得到一个现成的模型,虽然惊人的结果,因为你的答复是相当短,相当领域具体。如果您仍想尝试,下面是如何将
vader
模型与
nltk
一起使用的示例:

from nltk.sentiment.vader import SentimentIntensityAnalyzer
sid = SentimentIntensityAnalyzer()
sid.polarity_scores('Great place to work')
>>> {'neg': 0.0, 'neu': 0.423, 'pos': 0.577, 'compound': 0.6249}
sid.polarity_scores('Manager never listens')
>>> {'neg': 0.0, 'neu': 1.0, 'pos': 0.0, 'compound': 0.0}
正如您所见,您的里程数可能会有所不同


如果你有很多回应(数千),一个更可行的策略是手动标记一个样本,例如几十到几百个,并训练你自己的情绪分类器。以下是一些很好的教程,介绍了如何使用或进行情绪分析。我不认为你会得到一个现成的模型,虽然惊人的结果,因为你的答复是相当短,相当领域具体。如果您仍想尝试,下面是如何将
vader
模型与
nltk
一起使用的示例:

from nltk.sentiment.vader import SentimentIntensityAnalyzer
sid = SentimentIntensityAnalyzer()
sid.polarity_scores('Great place to work')
>>> {'neg': 0.0, 'neu': 0.423, 'pos': 0.577, 'compound': 0.6249}
sid.polarity_scores('Manager never listens')
>>> {'neg': 0.0, 'neu': 1.0, 'pos': 0.0, 'compound': 0.0}
正如您所见,您的里程数可能会有所不同


如果你有很多回应(数千),一个更可行的策略是手动标记一个样本,例如几十到几百个,并训练你自己的情绪分类器。这里有一些很好的教程,介绍了如何使用or或

进行情绪分析。如果数据集较小,可以使用逻辑回归进行情绪分析,因为这是一个分类问题。您可以在这里找到类似的示例:

如果您有较小的数据集,您可以使用逻辑回归进行情绪分析,因为这是一个分类问题。您可以在这里找到类似的示例:

textblob怎么样?例如:

from textblob import TextBlob
TextBlob('this sounds pretty good!').sentiment
输出:

Sentiment(polarity=0.5625, subjectivity=0.8)

textblob怎么样?例如:

from textblob import TextBlob
TextBlob('this sounds pretty good!').sentiment
输出:

Sentiment(polarity=0.5625, subjectivity=0.8)

是的,我今天早些时候用过这个。虽然没有得到最好的效果,但效果很好,所以我今天早些时候用了这个。虽然没有得到最好的结果,但效果很好,所以干杯