Scikit learn scikit学习任务管理库

Scikit learn scikit学习任务管理库,scikit-learn,Scikit Learn,更新: 经过一些额外的搜索。我瘦了,我过度学习了。如果我想要一个生产ML工具。我应该使用基于hadoop的mahout之类的东西。scikit learn更像是一个用于实验想法的玩具工具 我是新手。我尝试使用scikit来训练模型,我想尝试不同的特征组合和数据预处理技术。每个实验都需要几个小时(为了最大限度地减少错误,我将使用不同的列车测试拆分运行每个实验10次),所以我编写了一些python脚本来自动一个接一个地运行实验,当一个实验完成时,它会给我发一封电子邮件 它工作得很好,我找到了另一台服

更新: 经过一些额外的搜索。我瘦了,我过度学习了。如果我想要一个生产ML工具。我应该使用基于hadoop的mahout之类的东西。scikit learn更像是一个用于实验想法的玩具工具

我是新手。我尝试使用scikit来训练模型,我想尝试不同的特征组合和数据预处理技术。每个实验都需要几个小时(为了最大限度地减少错误,我将使用不同的列车测试拆分运行每个实验10次),所以我编写了一些python脚本来自动一个接一个地运行实验,当一个实验完成时,它会给我发一封电子邮件

它工作得很好,我找到了另一台服务器,今天可以运行我的实验,这似乎是合理的,我应该写一些脚本,可以以分发方式运行实验。有像hadoop这样的大数据平台,但我发现它不适合python和scikit学习(如果我对hadoop的理解是错误的,请向我指出)

因为scikit learn是一个“旧”库,所以我认为应该有现有的库具有我想要的这些功能。还是我在错误的方向上运行


我试着在谷歌上搜索“scikit学习任务管理”,但没有结果。其他搜索关键字也非常受欢迎。

请参阅

上的“实验框架”,例如,您想在服务器上提交作业(运行脚本)吗?你说“任务经理”是什么意思?我有很多实验要做。最有效的方法是在任何可用的服务器上自动运行它们。我可以编写脚本来实现这一点,事实上,我的脚本在单机上运行良好。但在我继续编写脚本以在多个服务器上分发任务之前。我想知道是否有库或工具具有这种能力。或者,如果这些要求不是scikit学习做事情的方式,您是否考虑过将Dask与scikit学习结合使用?嗨,克里斯托弗,这篇文章给了我一些下一步该做什么的想法。我所要做的就是写一些脚本,这样我就可以在有新想法的时候随时添加任务。因此,服务器将在现有任务完成后运行它。谢谢!这正是我想要的。