Python 合并单元格而不丢失数据中的信息_Python_Pandas

Python 合并单元格而不丢失数据中的信息

python pandas

Python 合并单元格而不丢失数据中的信息,python,pandas,Python,Pandas,我正在写一个程序，可以从Discogs音乐数据库中获取专辑信息。刮刀工作正常现在我有了一个数据框，其中有许多重复的艺术家和标题，只是格式单元不同（请参见下面我的数据框片段中的“Sido”、“Ich und keine Maske”）现在，我正在寻找一种方法，在不丢失信息的情况下合并这些双重条目。谁能给我一个提示吗？最终结果应如下所示： Interpret Title Formats 0

我正在写一个程序，可以从Discogs音乐数据库中获取专辑信息。刮刀工作正常

现在我有了一个数据框，其中有许多重复的艺术家和标题，只是格式单元不同（请参见下面我的数据框片段中的“Sido”、“Ich und keine Maske”）

现在，我正在寻找一种方法，在不丢失信息的情况下合并这些双重条目。谁能给我一个提示吗？最终结果应如下所示：

    Interpret                    Title                              Formats
0   Afrika Bambaataa And Family  The Decade Of Darkness 1990-2000   CD, Album, RE
1   Sha Hef                      Out The Mud
2   Sido                         Ich Und Keine Maske                CD, Album, 2xLP
...

我试过了

r = dataframe.groupby('Interpret')['Formate'].apply(','.join)

但是结果是熊猫系列的“标题”栏被删除了，所以我丢失了信息。

你试过了吗

将熊猫作为pd导入
df=pd.DataFrame（{'exploration'：['Afrika Bambaataa And Family'，'Sha Hef'，'Sido'，'Sido']，
‘标题’：[‘1990-2000年的黑暗十年’、‘走出泥潭’、‘我和基恩·马斯克’、‘我和基恩·马斯克’，
‘格式’：[‘CD，相册，RE’，‘CD，相册’，‘CD，相册’，‘2xLP，相册’]}
#删除重复的解释和合并格式。。。
df1=df.groupby（'explorate'）.agg（lambda x:'，'.join（x.unique（））.reset_index（）
#现在要消除“格式”列中的重复条目。。。
def drop_DUPE（世界其他地区）：
l=行。拆分（'，'）
返回“，”.join（列表（集合（l）））
df1['Formats']=df1['Formats']。应用（删除重复）

?？那就给你

Out[40]：
解释格式
0 Afrika Bambaataa和家庭。。。CD、RE、相册
1沙赫夫。。。唱片、相册
2西多。。。CD，相册，2xLP

基本上是对您找到的答案的一个稍加修改的版本。

您是否尝试将您的系列重新分配给专栏？类似于

dataframe['Formate']=dataframe.groupby（'exploration'）['Formate'].apply（'，'.join）

很高兴我能帮上忙！

r = dataframe.groupby('Interpret')['Formate'].apply(','.join)