Database 机器学习存储分类结果_Database_Machine Learning

Database 机器学习存储分类结果

database machine-learning

Database 机器学习存储分类结果,database,machine-learning,Database,Machine Learning,我有一些任务的数据集我想尝试不同的方法并存储结果以供进一步分析，此外，最好将分类结果存储在测试数据上，以查看分类在不同示例中的成功情况如果有任何特定的应用程序来存储不同分类的结果，比如我会指定不同分类的参数，然后进行分析，存储有趣的示例等等当然，第一个想法是使用DB，但是当我试图了解每个分类有多少不同的参数时，我知道将会有一个非常复杂的DB方案因此，在创建这样一个方案之前，我想知道您是否已经创建了用于此目的的内容。您只需将结果输出到CSV文件，例如以以下格式： index_of_inst

我有一些任务的数据集

我想尝试不同的方法并存储结果以供进一步分析，此外，最好将分类结果存储在测试数据上，以查看分类在不同示例中的成功情况

如果有任何特定的应用程序来存储不同分类的结果，比如我会指定不同分类的参数，然后进行分析，存储有趣的示例等等

当然，第一个想法是使用DB，但是当我试图了解每个分类有多少不同的参数时，我知道将会有一个非常复杂的DB方案

因此，在创建这样一个方案之前，我想知道您是否已经创建了用于此目的的内容。

您只需将结果输出到CSV文件，例如以以下格式：

index_of_instance,classification

并将它们与表示参数/设计选择的文件名或目录一起存储。

文件名可以表示您的参数。假设您正在运行一个具有{100200500}棵树和{0,10,20}最大深度的随机林。您的文件名可以是100_0.csv、200_0.csv等。您还可以保存您所在的交叉验证文件夹，例如：0_100_0.csv。通过这种方式，您可以在以后使用unix命令、Excel或更复杂的软件包（如R）的简单组合轻松地分析结果。

您可以简单地将结果输出到CSV文件，例如以以下格式输出：

index_of_instance,classification

并将它们与表示参数/设计选择的文件名或目录一起存储。

文件名可以表示您的参数。假设您正在运行一个具有{100200500}棵树和{0,10,20}最大深度的随机林。您的文件名可以是100_0.csv、200_0.csv等。您还可以保存您所在的交叉验证文件夹，例如：0_100_0.csv。通过这种方式，您可以在以后轻松地使用unix命令、Excel或更复杂的软件包（如R）组合分析结果。

非常感谢您的回答，我目前的做法非常类似，我认为可能有更可扩展的解决方案，当我尝试使用许多不同的参数进行许多不同的分类时，DB方法可能会有所帮助，但是每个分类的参数集是不同的，因此很容易升级。没问题。这个kaggle线程可能有一些帮助：我做了一些类似的事情，但发现在文件名中提供参数的名称及其值很有用，例如，

trees=100，depth=10，fold=1.csv

。这样，当你在一两个月后回头查看数据时，你的眼睛就不会交叉了。非常感谢你的回答，我目前做的事情非常类似，我认为可能有更可扩展的解决方案，当我尝试使用许多不同的参数进行许多不同的分类时，DB方法可能会有所帮助，但是，每个分类的参数集是不同的，因此很容易升级。没有问题。这个kaggle线程可能有一些帮助：我做了一些类似的事情，但发现在文件名中提供参数的名称及其值很有用，例如，

trees=100，depth=10，fold=1.csv

。这样，当你在一两个月后回头看数据时，你的眼睛就不会交叉了。