Python 如何计算Timeseries数据帧的概率?

Python 如何计算Timeseries数据帧的概率?,python,machine-learning,scikit-learn,Python,Machine Learning,Scikit Learn,我正在处理Timeseries数据帧。这里我有XAUUSD的历史数据 Date Open High Low Close 5008 2018-03-28 1345.66 1347.26 1323.94 1326.53 5009 2018-03-29 1326.81 1328.48 1322.02 1325.36 5010 2018-04-02 1326.91 1345.06 1326.13 1342.05 501

我正在处理Timeseries数据帧。这里我有XAUUSD的历史数据

            Date     Open     High      Low    Close
5008  2018-03-28  1345.66  1347.26  1323.94  1326.53
5009  2018-03-29  1326.81  1328.48  1322.02  1325.36
5010  2018-04-02  1326.91  1345.06  1326.13  1342.05
5011  2018-04-03  1341.86  1342.54  1329.53  1333.57
5012  2018-04-04  1333.48  1344.28  1331.77  1343.31
我想做的不是预测第二天的价格。我正试图得到未来几天价格的百分比

例如,高值可以是最大值还是最小值?或者低值可以是多少?包括%。假设它可以在1.0001%-1.015%之间增加

我不知道该用哪种型号。我使用了线性回归,但它仅用于预测价格。因此,我需要从模型中得到以下信息:

1. Train the past data
2. Get how much High away from yesterday's Close price (min/max)
3. Get how much High away from yesterday's Low price (min/max)
4. Sort values and show me all probabilities

你认为这在任何sklearn模型中都是可能的吗?

你想要的是来自频繁者模型的置信区间,或者来自贝叶斯模型的后验均值和方差

对于您的情况,您可以使用高斯过程来获得后验概率。它的意思是,它不是预测一个单一的值,也就是你期望的平均值,而是给你一个后验方差,你可以用它来观察模型预测结果的信心

在您的案例中,在一维数据低或高上拟合这些模型是非常简单的,您可以很好地将它们可视化,就像您看到的一样

我最喜欢的高斯过程实现是,但您可以使用任何您喜欢的


我将相同的概念应用于一个不同的问题,您可以继续阅读。

非常感谢。教程看起来很棒。我将看一看,并尝试将其应用于我的目的。我实际上是手动预测统计数据的。这是我遵循的方式:我得到了过去30天的开盘价-高-低-收盘价。并使用此技术生成统计数据。我从低开,高开,低开,低闭和高开得到移动百分比。最小的数量是明天价格的最大范围。所以这个模型应该告诉我75%将在1350-1354之间等等。