Python:如何在DataFrame中聚合值

Python:如何在DataFrame中聚合值,python,dataframe,Python,Dataframe,我有一个带有以下值的数据框 Text State This is a beutiful day California But I am stuck with code New York It's too hard California Can somebody please help me Florida I am new to

我有一个带有以下值的数据框

Text                                State
This is a beutiful day              California
But I am stuck with code            New York
It's too hard                       California
Can somebody please help me         Florida
I am new to python                  Florida
How should I solve this problem     New York
Day is turning bad                  New York
I am getting exhaused               California
Need some help                      New York
我需要对文本状态进行情感分析。我怎样才能将文本状态聚合起来,然后进行情感分析

df = df.groupby(df.columns.difference(['Text']))
result = pd.DataFrame(df['State'].unique(), columns=df.columns)

我试图这样做,以聚合文本第一,但它不工作。需要一些关于聚合的建议,以及如何使用数据帧中的循环执行情绪分析。

您可以使用lambda函数对文本进行分组,该函数使用提供的分隔符获取文本并连接

`delimiter = ' '
df2 =  df.groupby('State')['Text'].apply(lambda x: "%s" % delimiter.join(x)).reset_index()
print (df2)`

添加reset.index()将转换为您所需的数据帧

apply(delimiter.join)
就足够了。谢谢,它成功了。您还可以建议我现在应该如何对“df2”数据框的每一行进行情绪分析,以及如何预处理和简化文本列以删除所有停止词、标点符号和数字吗