Database 机器学习存储分类结果

Database 机器学习存储分类结果,database,machine-learning,Database,Machine Learning,我有一些任务的数据集 我想尝试不同的方法并存储结果以供进一步分析,此外,最好将分类结果存储在测试数据上,以查看分类在不同示例中的成功情况 如果有任何特定的应用程序来存储不同分类的结果,比如我会指定不同分类的参数,然后进行分析,存储有趣的示例等等 当然,第一个想法是使用DB,但是当我试图了解每个分类有多少不同的参数时,我知道将会有一个非常复杂的DB方案 因此,在创建这样一个方案之前,我想知道您是否已经创建了用于此目的的内容。您只需将结果输出到CSV文件,例如以以下格式: index_of_inst

我有一些任务的数据集

我想尝试不同的方法并存储结果以供进一步分析,此外,最好将分类结果存储在测试数据上,以查看分类在不同示例中的成功情况

如果有任何特定的应用程序来存储不同分类的结果,比如我会指定不同分类的参数,然后进行分析,存储有趣的示例等等

当然,第一个想法是使用DB,但是当我试图了解每个分类有多少不同的参数时,我知道将会有一个非常复杂的DB方案


因此,在创建这样一个方案之前,我想知道您是否已经创建了用于此目的的内容。

您只需将结果输出到CSV文件,例如以以下格式:

index_of_instance,classification 
并将它们与表示参数/设计选择的文件名或目录一起存储。
文件名可以表示您的参数。假设您正在运行一个具有{100200500}棵树和{0,10,20}最大深度的随机林。您的文件名可以是100_0.csv、200_0.csv等。您还可以保存您所在的交叉验证文件夹,例如:0_100_0.csv。通过这种方式,您可以在以后使用unix命令、Excel或更复杂的软件包(如R)的简单组合轻松地分析结果。

您可以简单地将结果输出到CSV文件,例如以以下格式输出:

index_of_instance,classification 
并将它们与表示参数/设计选择的文件名或目录一起存储。
文件名可以表示您的参数。假设您正在运行一个具有{100200500}棵树和{0,10,20}最大深度的随机林。您的文件名可以是100_0.csv、200_0.csv等。您还可以保存您所在的交叉验证文件夹,例如:0_100_0.csv。通过这种方式,您可以在以后轻松地使用unix命令、Excel或更复杂的软件包(如R)组合分析结果。

非常感谢您的回答,我目前的做法非常类似,我认为可能有更可扩展的解决方案,当我尝试使用许多不同的参数进行许多不同的分类时,DB方法可能会有所帮助,但是每个分类的参数集是不同的,因此很容易升级。没问题。这个kaggle线程可能有一些帮助:我做了一些类似的事情,但发现在文件名中提供参数的名称及其值很有用,例如,
trees=100,depth=10,fold=1.csv
。这样,当你在一两个月后回头查看数据时,你的眼睛就不会交叉了。非常感谢你的回答,我目前做的事情非常类似,我认为可能有更可扩展的解决方案,当我尝试使用许多不同的参数进行许多不同的分类时,DB方法可能会有所帮助,但是,每个分类的参数集是不同的,因此很容易升级。没有问题。这个kaggle线程可能有一些帮助:我做了一些类似的事情,但发现在文件名中提供参数的名称及其值很有用,例如,
trees=100,depth=10,fold=1.csv
。这样,当你在一两个月后回头看数据时,你的眼睛就不会交叉了。