Machine learning 机器学习算法选择

Machine learning 机器学习算法选择,machine-learning,Machine Learning,我是机器学习新手。我的问题是制作一台机器,根据学生的位置和兴趣区域为他选择一所大学。i、 e应选择学生地址所在城市的大学。我对算法的选择感到困惑。我可以使用感知器算法来完成这项任务吗 对于哪种机器学习算法最适合哪项任务,没有硬性规定。你最好的办法是尝试几种,看看哪一种效果最好。您可以使用,它实现了许多不同的机器学习算法。是的,你可以使用感知器算法来解决你的问题,但这并不是说你可以用它获得好的结果 根据您的描述,您试图解决的问题似乎并不真正需要机器学习。如果你只想让一个学生与最近的大学匹配,该大学

我是机器学习新手。我的问题是制作一台机器,根据学生的位置和兴趣区域为他选择一所大学。i、 e应选择学生地址所在城市的大学。我对算法的选择感到困惑。我可以使用感知器算法来完成这项任务吗

对于哪种机器学习算法最适合哪项任务,没有硬性规定。你最好的办法是尝试几种,看看哪一种效果最好。您可以使用,它实现了许多不同的机器学习算法。是的,你可以使用感知器算法来解决你的问题,但这并不是说你可以用它获得好的结果


根据您的描述,您试图解决的问题似乎并不真正需要机器学习。如果你只想让一个学生与最近的大学匹配,该大学在学生感兴趣的领域提供课程,那么你可以不需要任何学习就可以做到这一点。

我支持第一句话,即如果学生必须与大学生活在同一地区,你可能不需要机器学习。如果您想使用ML算法,也许最好考虑一下您必须从哪些数据开始。我想到的是一所大学的向量,每个特征都有特定的科目/领域。然后计算一个向量的距离,这对于学生来说是一个理想的特征向量。尽量缩短这段距离

您需要的第一件也是最早的一件事是一个带标签的数据集

听起来这个问题可以分解成一个ML问题,但是你首先需要一组正面和负面的例子来训练


你的数据集有多大?你们有什么功能?回答这些问题后,您可以选择最适合数据特征的算法。

我建议使用决策树解决这个问题,它类似于一组if-else规则。你可以把学生的位置和兴趣区域作为if和else if声明的条件,然后为他推荐一所大学。由于它是输入到输出的直接映射,基于规则的解决方案将起作用,这里不需要学习。

也许你可以使用推荐系统或聚类方法,你可以更深入地研究协作过滤推荐系统或k-均值聚类等技术,但正如一些人所说,首先,你需要从数据中学习,也许你的问题可以在没有ML的情况下得到解决。

好吧,这个问题没有直截了当的答案。答案取决于许多因素,比如问题陈述和您想要的输出类型、数据的类型和大小、可用的计算时间、特征的数量以及数据中的观察值等等

训练数据的大小

输出的准确性和/或可解释性

模型的准确性意味着该函数预测给定观测值的响应值,该值接近该观测值的真实响应值。高度可解释的算法限制性模型,如线性回归,意味着人们可以很容易地理解任何单个预测值与响应的关联,而灵活的模型以低解释性为代价提供更高的精度

速度还是训练时间 更高的精度通常意味着更高的训练时间。此外,算法需要更多的时间对大型训练数据进行训练。在实际应用中,算法的选择主要取决于这两个因素

像Naïve Bayes和线性和逻辑回归这样的算法易于实现,运行速度也很快。像支持向量机这样的算法涉及参数调整、具有高收敛时间的神经网络和随机森林,需要大量时间来训练数据

线性 许多算法基于这样一个假设:类可以通过直线或其更高维的类似物来分隔。例子包括逻辑回归和支持向量机。线性回归算法假设数据趋势遵循直线。如果数据是线性的,那么这些算法的性能相当好

功能数量 数据集可能有大量的特征,这些特征可能并不都是相关的和重要的。对于特定类型的数据,例如遗传学或文本,与数据点的数量相比,特征的数量可能非常大