Python 合并单元格而不丢失数据中的信息
我正在写一个程序,可以从Discogs音乐数据库中获取专辑信息。刮刀工作正常 现在我有了一个数据框,其中有许多重复的艺术家和标题,只是格式单元不同(请参见下面我的数据框片段中的“Sido”、“Ich und keine Maske”) 现在,我正在寻找一种方法,在不丢失信息的情况下合并这些双重条目。谁能给我一个提示吗?最终结果应如下所示:Python 合并单元格而不丢失数据中的信息,python,pandas,Python,Pandas,我正在写一个程序,可以从Discogs音乐数据库中获取专辑信息。刮刀工作正常 现在我有了一个数据框,其中有许多重复的艺术家和标题,只是格式单元不同(请参见下面我的数据框片段中的“Sido”、“Ich und keine Maske”) 现在,我正在寻找一种方法,在不丢失信息的情况下合并这些双重条目。谁能给我一个提示吗?最终结果应如下所示: Interpret Title Formats 0
Interpret Title Formats
0 Afrika Bambaataa And Family The Decade Of Darkness 1990-2000 CD, Album, RE
1 Sha Hef Out The Mud
2 Sido Ich Und Keine Maske CD, Album, 2xLP
...
我试过了
r = dataframe.groupby('Interpret')['Formate'].apply(','.join)
但是结果是熊猫系列的“标题”栏被删除了,所以我丢失了信息。你试过了吗
将熊猫作为pd导入
df=pd.DataFrame({'exploration':['Afrika Bambaataa And Family','Sha Hef','Sido','Sido'],
‘标题’:[‘1990-2000年的黑暗十年’、‘走出泥潭’、‘我和基恩·马斯克’、‘我和基恩·马斯克’,
‘格式’:[‘CD,相册,RE’,‘CD,相册’,‘CD,相册’,‘2xLP,相册’]}
#删除重复的解释和合并格式。。。
df1=df.groupby('explorate').agg(lambda x:','.join(x.unique()).reset_index()
#现在要消除“格式”列中的重复条目。。。
def drop_DUPE(世界其他地区):
l=行。拆分(',')
返回“,”.join(列表(集合(l)))
df1['Formats']=df1['Formats']。应用(删除重复)
??那就给你
Out[40]:
解释格式
0 Afrika Bambaataa和家庭。。。CD、RE、相册
1沙赫夫。。。唱片、相册
2西多。。。CD,相册,2xLP
基本上是对您找到的答案的一个稍加修改的版本。您是否尝试将您的系列重新分配给专栏?类似于
dataframe['Formate']=dataframe.groupby('exploration')['Formate'].apply(','.join)
很高兴我能帮上忙!
r = dataframe.groupby('Interpret')['Formate'].apply(','.join)