Optimization 组合时间序列指示器以提高预测能力

Optimization 组合时间序列指示器以提高预测能力,optimization,data-mining,Optimization,Data Mining,我正在开始一个数据分析项目,我很好奇处理以下情况的最佳方法是什么: 1个结果变量(数字), 4个预测变量(所有数值) 任何变量之间都没有关系(线性或非线性) python中的数据集: import pandas as pd import numpy as np pd.DataFrame( np.random.random([100,5])*100-50, columns=[['outcome','v1','v2','v3','v4']] )​ 寻求v1-v4的子集,使总和(结果)最大化,最少

我正在开始一个数据分析项目,我很好奇处理以下情况的最佳方法是什么:

1个结果变量(数字), 4个预测变量(所有数值)

任何变量之间都没有关系(线性或非线性)

python中的数据集:

import pandas as pd
import numpy as np
pd.DataFrame( np.random.random([100,5])*100-50, columns=[['outcome','v1','v2','v3','v4']]  )​
寻求v1-v4的子集,使总和(结果)最大化,最少5例。 如果没有最小输出约束5,我只需找到max(output)和v1-v4的值,我会使用它们作为过滤器。但由于我需要多个案例,我需要进行暴力搜索,如果这有意义的话,我认为这是对分类数据的优化

做这个优化搜索的好方法是什么

此外,如果有任何不清楚的地方,请发表评论


Ben

添加了一个数据集来帮助某人回答最近有了一个新的想法——将结果变量视为数字变量,将其他变量视为字符串或分类值。这可能有助于设置优化器。。