Pandas 如何对数据进行编码,以便与Pytorch LSTM一起使用

Pandas 如何对数据进行编码,以便与Pytorch LSTM一起使用,pandas,python-3.6,pytorch,lstm,Pandas,Python 3.6,Pytorch,Lstm,我正在尝试为情感分析问题设置Pytork LSTM。我目前一直在思考如何正确编码数据,以及LSTM需要什么样的数据 我有一个大约12000个句子的数据集,所有的标记都带有特定的情感。我的数据编码如下: 我创建了一个单独的数据集,其中包含句子中每个单词的词性标记。POS标签是一个热编码的: 0 1 83 [1,0,0..0], [0,1,0..0], ... [0,0,0..0] [0,0,0..1], [0,0,1..0], ... [1,0,0

我正在尝试为情感分析问题设置Pytork LSTM。我目前一直在思考如何正确编码数据,以及LSTM需要什么样的数据

我有一个大约12000个句子的数据集,所有的标记都带有特定的情感。我的数据编码如下:

我创建了一个单独的数据集,其中包含句子中每个单词的词性标记。POS标签是一个热编码的:

0           1               83
[1,0,0..0], [0,1,0..0], ... [0,0,0..0] 
[0,0,0..1], [0,0,1..0], ... [1,0,0..0]
...
每行是一句话。所有行的长度为84(较短的句子用零向量填充)。每个单元格中的列表对应于特定的pos标签,其长度为17

目标数据集的行数与上述数据集的行数相同,但每行仅包含一个列表,编码四种情绪中的一种:

0           
[1,0,0,0] 
[0,0,0,1]
...
我现在一直在研究如何将这些数据(尤其是pos数据集)插入lstm。文档说,LSTM需要输入维度和输出维度参数。我的输入维度到底是什么?每个序列的长度为84,但该序列中的每个项目都是长度为17的列表

我已经阅读了文档和一些教程,但是没有一个像我一样使用类似的数据结构。任何帮助都将不胜感激