Python 层序分类Tensorflow-LSTM

Python 层序分类Tensorflow-LSTM,python,tensorflow,lstm,sequence,Python,Tensorflow,Lstm,Sequence,我有一个如下所示的数据帧: id. date mycol label 1. 01/12/2019 c1 1 1. 03/12/2019 c2 1 1. 04/12/2019 c3 1 2. 01/12/2019 c1 0 2. 03/12/2019 c5 0

我有一个如下所示的数据帧:

id.   date           mycol       label

1.    01/12/2019      c1             1
1.    03/12/2019      c2             1
1.    04/12/2019      c3             1
2.    01/12/2019      c1             0
2.    03/12/2019      c5             0 
3.    15/01/2020       ..            1
4.     ...                           1
.
.

同一id的标签总是相同的,这是一个二进制分类问题。我想预测标签基于mycol只为每个id,我需要提前5个月作出预测。我想我应该使用LSTM,但问题在于日期和如何设置序列,因为我以前没有见过这种问题,我只是从LSTM开始。按id分组可以为每行提供非常大的mycl值列表。我不知道如何以月/周来区分这些值,如果我真的应该这样做,还是应该将它们像那样放在每行1个巨大的列表中。非常感谢您的帮助。

您的第一个输入序列应该是[c1,c2,c3],标签为-1

第二个-[c1,c5],标签-0


序列长度无关紧要(不必添加填充)。LSTM学习如何根据新输入(序列元素)更改其状态权重。

您能解释一下吗?我不知道该怎么做。我需要按id对它们进行分组吗?如果是,我可以用什么方式使用LSTMS/什么参数?我看到了您的更新。序列长度不同有关系吗?LSTM将如何考虑这一点?另外,我如何提前6个月预测?这是LSTMs中的参数吗?谢谢。我还是不确定,我怎么说一组30人到LSTM是什么?根据之前6个月的历史,它如何知道我提前6个月预测?你的最初问题是分类任务:你有一个序列作为输入,标签作为输出。请澄清-您将如何提前6个月预测:您想预测mycol而不是标签吗?如果是这样-您必须训练另一个LSTM预测mycol 6个月,然后将预测序列输入第一个LSTM进行分类。如果您的标签影响mycol-训练一个LSTM可能更有效,以实现这两个目的(因为LSTM有两个输出)。你需要使用由两个损失组成的损失(每个目的都有单独的损失),我认为你应该把这个问题作为一个时间序列问题来处理。是的,LSTM可以解决这个问题,但是试着使用一个更简单的模型,比如ARIMA或ARIMADo的一些变体。你有任何例子说明这是如何工作的吗?