Machine learning 机器学习-进化智能

Machine learning 机器学习-进化智能,machine-learning,artificial-intelligence,Machine Learning,Artificial Intelligence,对构建包含这些方面的ML模型的概念和步骤有一些了解- 理解问题并将其归类为监督问题或 无监督、回归或分类或聚类等 特征设计,即要考虑的特征/输入参数 将数据拆分为训练集和测试集。(交叉验证是必要的 这里还有一个重要的概念。) 比较各种模型(如KNN、SVM、随机森林等),了解哪些模型效果良好。基本上,交叉验证分数并了解预测能力 怀疑:: 如何将更新的数据提供给ML以保持其更新和更好的预测 没有什么需要最终确定的,一旦你得到了新的数据,你可以用所有相关的数据重新训练你的模型,或者更新你的模型(例如

对构建包含这些方面的ML模型的概念和步骤有一些了解-

  • 理解问题并将其归类为监督问题或 无监督、回归或分类或聚类等
  • 特征设计,即要考虑的特征/输入参数

  • 将数据拆分为训练集和测试集。(交叉验证是必要的 这里还有一个重要的概念。)

  • 比较各种模型(如KNN、SVM、随机森林等),了解哪些模型效果良好。基本上,交叉验证分数并了解预测能力
  • 怀疑::

    如何将更新的数据提供给ML以保持其更新和更好的预测

  • 没有什么需要最终确定的,一旦你得到了新的数据,你可以用所有相关的数据重新训练你的模型,或者更新你的模型(例如线性回归的另一次梯度下降迭代)

  • 如果是相关数据,即来自同一分布的数据,则不应“损害”模型

  • 这与#1基本上是同一个问题。细节取决于模型。有些模型你只需要用所有相关数据进行再培训。某些模型可以使用新数据进行更新


  • 抱歉,但是我仍然没有得到在我的帖子中被违反的SO协议。我应该在数据科学交换、标题或一些代码片段中问这个问题吗?最好是在“请检查一般问题”中问这个问题。@mods:我以更好的格式问了这个问题,并提供了有关“数据科学”堆栈交换的更多详细信息,并且从社区收到了非常有用的建议。我可以删除这整个线程,因为这不再是有用的,并恢复我的发帖能力?我不认为再需要编辑这篇文章了。我得到了我问题的答案,这就是模型过时的问题-