Python 合并单元格而不丢失数据中的信息

Python 合并单元格而不丢失数据中的信息,python,pandas,Python,Pandas,我正在写一个程序,可以从Discogs音乐数据库中获取专辑信息。刮刀工作正常 现在我有了一个数据框,其中有许多重复的艺术家和标题,只是格式单元不同(请参见下面我的数据框片段中的“Sido”、“Ich und keine Maske”) 现在,我正在寻找一种方法,在不丢失信息的情况下合并这些双重条目。谁能给我一个提示吗?最终结果应如下所示: Interpret Title Formats 0

我正在写一个程序,可以从Discogs音乐数据库中获取专辑信息。刮刀工作正常

现在我有了一个数据框,其中有许多重复的艺术家和标题,只是格式单元不同(请参见下面我的数据框片段中的“Sido”、“Ich und keine Maske”)

现在,我正在寻找一种方法,在不丢失信息的情况下合并这些双重条目。谁能给我一个提示吗?最终结果应如下所示:

    Interpret                    Title                              Formats
0   Afrika Bambaataa And Family  The Decade Of Darkness 1990-2000   CD, Album, RE
1   Sha Hef                      Out The Mud
2   Sido                         Ich Und Keine Maske                CD, Album, 2xLP
...
我试过了

r = dataframe.groupby('Interpret')['Formate'].apply(','.join)
但是结果是熊猫系列的“标题”栏被删除了,所以我丢失了信息。

你试过了吗

将熊猫作为pd导入
df=pd.DataFrame({'exploration':['Afrika Bambaataa And Family','Sha Hef','Sido','Sido'],
‘标题’:[‘1990-2000年的黑暗十年’、‘走出泥潭’、‘我和基恩·马斯克’、‘我和基恩·马斯克’,
‘格式’:[‘CD,相册,RE’,‘CD,相册’,‘CD,相册’,‘2xLP,相册’]}
#删除重复的解释和合并格式。。。
df1=df.groupby('explorate').agg(lambda x:','.join(x.unique()).reset_index()
#现在要消除“格式”列中的重复条目。。。
def drop_DUPE(世界其他地区):
l=行。拆分(',')
返回“,”.join(列表(集合(l)))
df1['Formats']=df1['Formats']。应用(删除重复)
??那就给你

Out[40]:
解释格式
0 Afrika Bambaataa和家庭。。。CD、RE、相册
1沙赫夫。。。唱片、相册
2西多。。。CD,相册,2xLP

基本上是对您找到的答案的一个稍加修改的版本。

您是否尝试将您的系列重新分配给专栏?类似于
dataframe['Formate']=dataframe.groupby('exploration')['Formate'].apply(','.join)
很高兴我能帮上忙!
r = dataframe.groupby('Interpret')['Formate'].apply(','.join)