Machine learning 用ML算法预测股票收益率

Machine learning 用ML算法预测股票收益率,machine-learning,prediction,stocks,Machine Learning,Prediction,Stocks,我正在研究一个固定时间段(比如n天)的股票收益预测模型。我希望提前收集一些想法。我的问题是: 1最好将其转化为一个分类问题,比如说创建一个返回值大于x%的伪变量?然后我可以尝试所有的ML算法 2如果我不将其转化为分类问题,而是使用回归模型,那么将收益转化为日志是否有意义或必要 任何想法都很感激 编辑:我的目标是相对宽泛的定义,从这个意义上说,我只想提高选择过程的性能,选择正回报,避免负回报 什么质量最好?将其转化为阈值问题只意味着将问题空间转化为更简单的问题空间。你的问题定义是你自己的;您可以将

我正在研究一个固定时间段(比如n天)的股票收益预测模型。我希望提前收集一些想法。我的问题是:

1最好将其转化为一个分类问题,比如说创建一个返回值大于x%的伪变量?然后我可以尝试所有的ML算法

2如果我不将其转化为分类问题,而是使用回归模型,那么将收益转化为日志是否有意义或必要

任何想法都很感激

编辑:我的目标是相对宽泛的定义,从这个意义上说,我只想提高选择过程的性能,选择正回报,避免负回报

什么质量最好?将其转化为阈值问题只意味着将问题空间转化为更简单的问题空间。你的问题定义是你自己的;您可以将其转化为一个二进制分类问题>x或非二进制分类问题,一个多类分类问题,将其分为多个范围,或者简单地将其作为一个预测任务。如果使用后一种方法,仍然可以将装箱或分类应用为后处理步骤。 分类只是预测的一个子类。逻辑回归采用的对数变换不过是一种巧妙的技巧,可以将输出转化为类似概率分布的东西;不要想得太多。也就是说,在输出上应用转换并不一定是坏的,例如,您可以应用一些规范化来将输出保持在某个激活函数的范围内。
感谢您分享一些见解。这是有道理的。我的目标是相对宽泛的,所以任何提高选择赢家和输家能力的方法都会有帮助;从N类分类到预测的更改归结为简单地更改任何高级ML库(如keras)上的输出层和损失函数。直观地说,对于stock=51和stock=5*10e10,预测空间比分类空间stock>50返回1的信息更丰富,但50和5*10e10之间的MSE是巨大的,因此假设您有足够的数据,您的模型将从预测中受益更多。也就是说,请记住,股票预测并不是一件容易建模的事情,因为基础系统是混乱的。这很有好处。是的,我同意。我将尝试这两种方法,看看它们的性能如何。是的,股票价格预测确实很难建模,我同意。