Python 3.x 从Keras'重构新闻文本；路透社数据集_Python 3.x_Data Structures_Dataset_Keras_Reuters

Python 3.x 从Keras'重构新闻文本；路透社数据集

python-3.x data-structures keras

Python 3.x 从Keras'重构新闻文本；路透社数据集,python-3.x,data-structures,dataset,keras,reuters,Python 3.x,Data Structures,Dataset,Keras,Reuters,我似乎无法理解Keras的路透社数据集提供的数据集集合的加载方式如下所示： (x_train, y_train), (x_test, y_test) = reuters.load_data() 据我所知，“x”数组是来自新闻故事的单词索引序列（列表）的数组，“y”数组是这些序列主题的数组但当我试图用提供的词典将其中一个序列的单词索引翻译成实际单词时： wordDict = {y:x for x,y in reuters.get_word_index().items()} for ind

我似乎无法理解Keras的路透社数据集提供的数据集

集合的加载方式如下所示：

(x_train, y_train), (x_test, y_test) = reuters.load_data()

据我所知，“x”数组是来自新闻故事的单词索引序列（列表）的数组，“y”数组是这些序列主题的数组

但当我试图用提供的词典将其中一个序列的单词索引翻译成实际单词时：

wordDict = {y:x for x,y in reuters.get_word_index().items()}  
for index in x_train[0]:
    print (wordDict.get(index))

这个顺序似乎毫无意义。我怎样才能把这些片段转换回原来的新闻呢

编辑：

发现了一条类似的线。字典中的索引似乎与数据集中的单词索引不匹配。但是重新下载数据并不能解决我的问题。

加载数据参数“index\u from”的默认值允许实际单词的索引设置为>3。可以使用

wordDict.get（index-3）

重新构建文本，请参见中的单元格6