Python分组并合并所有文本
在python中处理NLP项目时,是否有一种方法可以将下面的所有反馈按特定问题组分组Python分组并合并所有文本,python,pandas,join,nlp,Python,Pandas,Join,Nlp,在python中处理NLP项目时,是否有一种方法可以将下面的所有反馈按特定问题组分组 Out[40]: 问题组反馈 24个配件不,只需制作更长的充电线:) 49配件所有东西都很有用,处理得很好 1003连接继续做你正在做的事情。 没有!继续努力! 预期结果将是: 问题组反馈 配件没有,只是做一根更长的充电线:)一切都很有用,而且处理得很好 继续做你正在做的事情,没有!继续努力! 这里有一个例子: import pandas as pd text = [ ('Accessories','Nope
Out[40]:
问题组反馈
24个配件不,只需制作更长的充电线:)
49配件所有东西都很有用,处理得很好
1003连接继续做你正在做的事情。
没有!继续努力!
预期结果将是:
问题组反馈
配件没有,只是做一根更长的充电线:)一切都很有用,而且处理得很好
继续做你正在做的事情,没有!继续努力!
这里有一个例子:
import pandas as pd
text = [ ('Accessories','Nope, just make a longer charging cord :)') ,
('Accessories','Everything was very helpful and nice handled' ) ,
('Connectivity','kEEP DOING WHAT YOU ARE DOING'),
('Connectivity','None! Keep up the good work!') ]
df = pd.DataFrame(text, columns = ['Col1' , 'Col2'])
print(pd.pivot_table(df,index=['Col1'],values='Col2',aggfunc=lambda x: ','.join(x)))
你可以试试groupby
df.groupby('Issue Group').agg(lambda x: ','.join(x))
此文件的输出将是以逗号分隔的文本
Nope, just make a longer charging cord :),Everything was very helpful and nice handled
kEEP DOING WHAT YOU ARE DOING,None! Keep up the good work!
如果要在输出中显示列表
df.groupby('Issue Group').agg(list)
其输出将以如下形式列出:
['Nope, just make a longer charging cord :)', 'Everything was very helpful and nice handled']
['kEEP DOING WHAT YOU ARE DOING', 'None! Keep up the good work!']
输出是一个列表??是的,是文本声明中的文本列表=[]。。。。“有没有办法通过连接和附件获得所有反馈?我有4200行分布在这两个区域。我希望有其他方法可以做到。非常感谢您您您的输入是列表还是数据帧?输入方面,它是来自csv.NET文件的数据帧提要