Machine learning 类数不断增加的多类分类

Machine learning 类数不断增加的多类分类,machine-learning,classification,Machine Learning,Classification,我有一个关于音乐收听历史的数据集:听音乐的时间、地点、外面的天气(还有很多其他功能即将推出)以及一个曲目id作为标签 我试图预测在任何给定环境下我喜欢的轨道(时间+地点+天气) 我想在此数据上运行多类分类,但存在以下问题: 不断将我的轨迹ID映射到类[0..distinct\u trackid\u count)并返回 我有大量的课程(成千上万) 类的数量在不断增长,所以我从一开始就必须重新训练我的算法 我有一种感觉,在这里我不需要多类分类,我需要帮助找出如何解决这个问题,我可能会尝试一些方

我有一个关于音乐收听历史的数据集:听音乐的时间、地点、外面的天气(还有很多其他功能即将推出)以及一个曲目id作为标签

我试图预测在任何给定环境下我喜欢的轨道(时间+地点+天气)

我想在此数据上运行多类分类,但存在以下问题:

  • 不断将我的轨迹ID映射到类[0..distinct\u trackid\u count)并返回
  • 我有大量的课程(成千上万)
  • 类的数量在不断增长,所以我从一开始就必须重新训练我的算法

我有一种感觉,在这里我不需要多类分类,我需要帮助找出如何解决这个问题,我可能会尝试一些方法(我不确定它们是否能很好地工作):

  • 不要使用分类,使用回归:给定特征,回归将返回一个有理数。将其四舍五入,并选择具有该ID/编号的曲目进行收听。这应该允许您使用任何在线学习算法,当新歌出现时,只需将其特征和目标输入算法。这样,您就不必做任何操作为每首新歌进行再培训

  • 使用最近邻方法:给定一组功能,从您的歌曲中找到最接近的功能集,然后选择该歌曲。也不需要完全重新培训,但可能效率低下


  • 您可能还想研究关系关联规则。

    我可能会尝试一些方法(我不确定它们是否能正常工作):

  • 不要使用分类,使用回归:给定特征,回归将返回一个有理数。将其四舍五入,并选择具有该ID/编号的曲目进行收听。这应该允许您使用任何在线学习算法,当新歌出现时,只需将其特征和目标输入算法。这样,您就不必做任何操作为每首新歌进行再培训

  • 使用最近邻方法:给定一组功能,从您的歌曲中找到最接近的功能集,然后选择该歌曲。也不需要完全重新培训,但可能效率低下


  • 您可能还想研究关系关联规则。

    我可能会尝试一些方法(我不确定它们是否能正常工作):

  • 不要使用分类,使用回归:给定特征,回归将返回一个有理数。将其四舍五入,并选择具有该ID/编号的曲目进行收听。这应该允许您使用任何在线学习算法,当新歌出现时,只需将其特征和目标输入算法。这样,您就不必做任何操作为每首新歌进行再培训

  • 使用最近邻方法:给定一组功能,从您的歌曲中找到最接近的功能集,然后选择该歌曲。也不需要完全重新培训,但可能效率低下


  • 您可能还想研究关系关联规则。

    我可能会尝试一些方法(我不确定它们是否能正常工作):

  • 不要使用分类,使用回归:给定特征,回归将返回一个有理数。将其四舍五入,并选择具有该ID/编号的曲目进行收听。这应该允许您使用任何在线学习算法,当新歌出现时,只需将其特征和目标输入算法。这样,您就不必做任何操作为每首新歌进行再培训

  • 使用最近邻方法:给定一组功能,从您的歌曲中找到最接近的功能集,然后选择该歌曲。也不需要完全重新培训,但可能效率低下


  • 你可能还想研究关系关联规则。

    如果我是你,我会先尝试一些降维的想法,然后进行多类分类。使用简单的聚类或特征提取算法,你应该能够创建一些歌曲组(10-100组)。如果你将这些群体视为一个类,我认为你将能够很好地学习这些功能,从而能够在给定的环境中推荐你喜欢的歌曲。更不用说,在这之后,问题变得非常容易处理


    然而,如果你只想要一首“完美”的歌曲,K-最近邻可能是你最好的选择。

    如果我是你,我会先尝试一些降维的想法,然后进行多类分类。使用简单的聚类或特征提取算法,你应该能够创建一些歌曲组(10-100组)。如果你将这些组视为课程,我认为你将能够很好地学习这些功能,以便能够在给定的环境中推荐你喜欢的歌曲。更不用说,在这之后,问题变得非常容易处理


    然而,如果你只想要一首“完美”的歌曲,K-最近邻可能是你最好的选择。

    如果我是你,我会先尝试一些降维的想法,然后进行多类分类。使用简单的聚类或特征提取算法,你应该能够创建一些歌曲组(10-100组)。如果你将这些组视为课程,我认为你将能够很好地学习这些功能,以便能够在给定的环境中推荐你喜欢的歌曲。更不用说,在这之后,问题变得非常容易处理


    然而,如果你只想要一首“完美”的歌曲,K-最近邻可能是你最好的选择。

    如果我是你,我会先尝试一些降维的想法,然后进行多类分类。使用简单的聚类或特征提取算法,你应该能够创建一些歌曲组(10-100组)。如果您将这些组视为类,我认为您将能够很好地学习这些功能,以便能够推荐我