Algorithm 什么机器学习算法是合适的?

Algorithm 什么机器学习算法是合适的?,algorithm,machine-learning,Algorithm,Machine Learning,我正在研究一个预测器,根据天气和葡萄的特性,即糖分水平、Ph值、酸度,来了解葡萄收获的最可能时期。我有两个数据集,我正在考虑如何将它们合并在一起:一个是2003-2013年期间一些意大利葡萄园的收获前分析数据,另一个是这十年的天气。我想做的是从我的样本中学习什么时候收割,给定一个最佳糖分水平、Ph值和酸度的范围,并给出天气预报。 我认为一些强化学习方法可以奏效。由于在葡萄成熟期间,采前分析大约进行了5次,我认为这些可能是我所处的状态,而天气条件可能是从一种状态到另一种状态的“概率”。 然而,我不

我正在研究一个预测器,根据天气和葡萄的特性,即糖分水平、Ph值、酸度,来了解葡萄收获的最可能时期。我有两个数据集,我正在考虑如何将它们合并在一起:一个是2003-2013年期间一些意大利葡萄园的收获前分析数据,另一个是这十年的天气。我想做的是从我的样本中学习什么时候收割,给定一个最佳糖分水平、Ph值和酸度的范围,并给出天气预报。 我认为一些强化学习方法可以奏效。由于在葡萄成熟期间,采前分析大约进行了5次,我认为这些可能是我所处的状态,而天气条件可能是从一种状态到另一种状态的“概率”。 然而,我不确定哪种算法是最好的,因为每个状态和每个“概率”都取决于几个变量。我被告知隐马尔可夫模型可以工作,但在我看来,我的问题并不完全符合模型。
你有什么建议吗?Thx提前

这与实际的算法无关,但您将遇到的问题是天气非常局部。信不信由你,一个葡萄园的天气可能与另一个葡萄园完全不同,离它只有一英里远。如果你在每个葡萄园安装雨量计,你会发现这一点。为了获得真正好的结果,你需要在每个葡萄园都有一个小型气象站。如果没有这一点,你最好的选择是只使用天气测量附近的葡萄园。例如,如果您的数据来自机场,请仅使用机场旁边的葡萄园

当你可以控制动作时,强化学习是合适的。这就像猴子按按钮一样。你按下一个按钮就会感到震惊,所以你不会再按那个按钮了。在这里,你有一个被动的数据集,不能进行实验行动,因此强化学习不适用

这里有一组复杂的非受控输入、天气数据、受控输入(收获时间)和几个输出参数、糖等。给定这些数据,您希望预测未来未知天气模式的收获时间

一般来说,你所做的是:试图找出你的因素是如何影响结果的。棘手的是,结果可能是由一些不明显的模式驱动的。例如,可能是3周的干旱,然后是2周的大雨,这意味着最好的收获将是65天,或者类似的时间

所以,你要做的是对数据进行特征化,以可能的方式对其进行描述,然后进行敏感性分析。如果分析有很强的相关性,那么您已经找到了解决方案。如果没有,那么您必须找到一种不同的方法对数据进行特征化。例如,您的特征化可能是降雨量超过2英寸的天数,也可能是无雨天数最多,或者可能是阳光灿烂的总天数。可能多个功能组合在一起形成一个解决方案。这些选择仅限于你的想象力

当然,正如我在上面所说的,美中不足的是,你的天气数据将只大致近似于特定葡萄园的真实天气,因此数据中会有噪音,可能会有太多噪音,以至于无法获得好的结果

为什么你不太关心天气

回到数据上来,拥有不可靠的天气信息其实不是问题,因为你实际上并不太在乎天气。原因有两方面。首先,你试图回答的问题不是什么时候收获葡萄,而是是否等待收获。酿酒师总是可以测量葡萄当前的糖分。所以,他必须做出决定,“我是应该现在收获含糖X%的葡萄,还是应该等到以后再得到更好的含糖Z%?要回答这个问题,你需要的真正数据不是天气,而是一系列随时间变化的糖分/酸度读数。你想预测的是,在某种情况下,葡萄会变得更好还是更糟


其次,葡萄藤有他们喜欢的最佳湿度。如果葡萄藤太干,那就不好;如果太湿,那就不好。你无法从天气预测葡萄树的湿度。有些土壤能很好地保持水分,有些则是沙质的。砂质葡萄园比粘土葡萄园需要更多的雨水才能保持相同的湿度水平。此外,葡萄酒商可以给他的葡萄园浇水,完全破坏了降雨模式。因此,天气几乎是一个非因素。

我同意泰勒的观点,从可行的角度来看,天气可能会损害你的分析。不过,我认为这是供您测试和发现的可能会有一些有趣的数据

我不确定你的测试到底是什么,但一个简单的开始方法可能是使用svm(甚至是逻辑回归,因为你需要概率)将其转化为一个分类问题,并使用所有数据作为算法的输入-假设你知道哪些年份是好收成年份或不好收成年份。您甚至可以单独测试每个变量,看看它如何影响您的性能。如果可以的话,我建议你这样做,因为网上有大量的信息来源,这里有很多人,这样可以帮助你调整你的算法

当你掌握了这一点,我会,就像你之前被建议的那样,尝试一下嗯-因为它会告诉你哪一天可能是收获最好的一天。这是天气可能会受到影响的地方,但通过简单的实验,你会对你的数据有更多的了解

我所学到的关于机器学习的一个想法是,虽然有关于何时选择哪种机器的指导方针