Python 机器学习中的数据帧修改
所以我创建了一个推荐机器学习模型,上面是数据集 名字是歌曲的名字,歌曲是mp3文件,喜欢的是歌曲所拥有的Python 机器学习中的数据帧修改,python,pandas,dataframe,Python,Pandas,Dataframe,所以我创建了一个推荐机器学习模型,上面是数据集 名字是歌曲的名字,歌曲是mp3文件,喜欢的是歌曲所拥有的 id name song likes 0 1 eeee song.mp3 70 1 2 aaaa song.mp3 59 2 3 any song song.mp3 7 3 6 australia son
id name song likes
0 1 eeee song.mp3 70
1 2 aaaa song.mp3 59
2 3 any song song.mp3 7
3 6 australia song.mp3 99
4 7 qwert song.mp3 0
5 9 summer song.mp3 10
在这里,song_id是上述数据集中歌曲的id,performer是在歌曲中表演的艺术家的id,一首歌曲可以有多个艺术家,因为您可以看到id为1的歌曲有3个艺术家id与之关联,命名为9,10,11
song_id performer
0 1 9
1 1 10
2 1 11
3 2 9
4 2 10
5 2 11
6 2 5
7 3 9
8 3 10
9 6 5
10 6 9
11 6 10
12 6 11
13 6 16
14 7 5
15 7 9
16 7 10
17 7 11
18 7 16
19 9 16
20 9 17
如何将两个数据集合并为一个数据集?如何在我的数据框中显示这一“一首歌-多个表演者”的关系?如您所见,共有6首歌曲和21首歌曲与表演者的关系。请查看合并是否有效-
df2.merge(df1)
请不要将代码或数据发布为图像-而是将其复制并粘贴为文本。这是一个关于如何连接/合并两个数据帧的标准问题,与机器学习(或K-means)无关-请不要垃圾邮件发送不相关的标签(已删除)。