Pandas 如何对数据进行编码，以便与Pytorch LSTM一起使用_Pandas_Python 3.6_Pytorch_Lstm

Pandas 如何对数据进行编码，以便与Pytorch LSTM一起使用

pandas pytorch

Pandas 如何对数据进行编码，以便与Pytorch LSTM一起使用,pandas,python-3.6,pytorch,lstm,Pandas,Python 3.6,Pytorch,Lstm,我正在尝试为情感分析问题设置Pytork LSTM。我目前一直在思考如何正确编码数据，以及LSTM需要什么样的数据我有一个大约12000个句子的数据集，所有的标记都带有特定的情感。我的数据编码如下：我创建了一个单独的数据集，其中包含句子中每个单词的词性标记。POS标签是一个热编码的： 0 1 83 [1,0,0..0], [0,1,0..0], ... [0,0,0..0] [0,0,0..1], [0,0,1..0], ... [1,0,0

我正在尝试为情感分析问题设置Pytork LSTM。我目前一直在思考如何正确编码数据，以及LSTM需要什么样的数据

我有一个大约12000个句子的数据集，所有的标记都带有特定的情感。我的数据编码如下：

我创建了一个单独的数据集，其中包含句子中每个单词的词性标记。POS标签是一个热编码的：

0           1               83
[1,0,0..0], [0,1,0..0], ... [0,0,0..0] 
[0,0,0..1], [0,0,1..0], ... [1,0,0..0]
...

每行是一句话。所有行的长度为84（较短的句子用零向量填充）。每个单元格中的列表对应于特定的pos标签，其长度为17

目标数据集的行数与上述数据集的行数相同，但每行仅包含一个列表，编码四种情绪中的一种：

0           
[1,0,0,0] 
[0,0,0,1]
...

我现在一直在研究如何将这些数据（尤其是pos数据集）插入lstm。文档说，LSTM需要输入维度和输出维度参数。我的输入维度到底是什么？每个序列的长度为84，但该序列中的每个项目都是长度为17的列表

我已经阅读了文档和一些教程，但是没有一个像我一样使用类似的数据结构。任何帮助都将不胜感激