Machine learning 如何在预测/回归模型中将列表作为条目处理属性?

Machine learning 如何在预测/回归模型中将列表作为条目处理属性?,machine-learning,regression,data-mining,Machine Learning,Regression,Data Mining,我正在为音乐产业做一个预测模型。为此,我有一个数据库,里面有很多歌曲的数据。例如姓名、制作人或艺术家。 我的问题是,有很多数据以列表作为条目。例如,有很多歌曲有不止一位艺术家 我可以分割这些条目,这样我就有多个艺术家栏,但我不知道如何处理所有的空行。当一首歌列出了5位艺术家,但大多数歌曲只有一位艺术家时,大多数歌曲会有四个空栏 这是最好的处理方法吗?我想把所有的歌曲都限制在一个艺人的范围内,但是艺人的名字是按字母顺序排列的,所以我有风险从歌曲中删除超级明星,这可能会使我的预测无效 因为数据点可以

我正在为音乐产业做一个预测模型。为此,我有一个数据库,里面有很多歌曲的数据。例如姓名、制作人或艺术家。 我的问题是,有很多数据以列表作为条目。例如,有很多歌曲有不止一位艺术家

我可以分割这些条目,这样我就有多个艺术家栏,但我不知道如何处理所有的空行。当一首歌列出了5位艺术家,但大多数歌曲只有一位艺术家时,大多数歌曲会有四个空栏

这是最好的处理方法吗?我想把所有的歌曲都限制在一个艺人的范围内,但是艺人的名字是按字母顺序排列的,所以我有风险从歌曲中删除超级明星,这可能会使我的预测无效


因为数据点可以有1:n个条目,所以处理空行的最佳方法是什么?

将数据表示为图形,而不是单个表

任何合适的方法都需要允许n:m个连接,因此您可以使用多个表(显然,不必在任何地方使用相同的唯一键,也可以简单地作为一个图

| Song 1 | Artist 1 |
| Song 1 | Artist 2 |
| Song 2 | Artist 3 |
等等-SQL数据库中非常经典的链接表,带有两个外键