Python:如何在DataFrame中聚合值
我有一个带有以下值的数据框Python:如何在DataFrame中聚合值,python,dataframe,Python,Dataframe,我有一个带有以下值的数据框 Text State This is a beutiful day California But I am stuck with code New York It's too hard California Can somebody please help me Florida I am new to
Text State
This is a beutiful day California
But I am stuck with code New York
It's too hard California
Can somebody please help me Florida
I am new to python Florida
How should I solve this problem New York
Day is turning bad New York
I am getting exhaused California
Need some help New York
我需要对文本状态进行情感分析。我怎样才能将文本状态聚合起来,然后进行情感分析
df = df.groupby(df.columns.difference(['Text']))
result = pd.DataFrame(df['State'].unique(), columns=df.columns)
我试图这样做,以聚合文本第一,但它不工作。需要一些关于聚合的建议,以及如何使用数据帧中的循环执行情绪分析。您可以使用lambda函数对文本进行分组,该函数使用提供的分隔符获取文本并连接
`delimiter = ' '
df2 = df.groupby('State')['Text'].apply(lambda x: "%s" % delimiter.join(x)).reset_index()
print (df2)`
添加reset.index()将转换为您所需的数据帧
apply(delimiter.join)
就足够了。谢谢,它成功了。您还可以建议我现在应该如何对“df2”数据框的每一行进行情绪分析,以及如何预处理和简化文本列以删除所有停止词、标点符号和数字吗