Python Keras IMDB数据集0与ovv_字符

Python Keras IMDB数据集0与ovv_字符,python,tensorflow,keras,Python,Tensorflow,Keras,我正在查看的文档中显示: 按照惯例,“0”并不代表特定的单词,而是用于对任何未知单词进行编码 但是,当我尝试以下操作时,在数据中看不到“0”: (inputTrain, yTrain), (inputTest, yTest) = imdb.load_data(num_words=vocabSize) 我错过什么了吗?我也没有看到在预处理代码中添加“0” 按照惯例,“0”并不代表特定的单词,而是用于对任何未知单词进行编码 这里的文档是错误的。在Keras IMDB数据集中,值: “0”表示填充

我正在查看的文档中显示:

按照惯例,“0”并不代表特定的单词,而是用于对任何未知单词进行编码

但是,当我尝试以下操作时,在数据中看不到“0”:

(inputTrain, yTrain), (inputTest, yTest) = imdb.load_data(num_words=vocabSize)
我错过什么了吗?我也没有看到在预处理代码中添加“0”

按照惯例,“0”并不代表特定的单词,而是用于对任何未知单词进行编码

这里的文档是错误的。在Keras IMDB数据集中,值:

  • “0”表示填充(即使所有序列具有所需的相同长度)
  • “1”表示开始标记,即表示文档的开始
  • “2”代表OOV(词汇表外)标记,即表示字典中未包含的所有标记,或文档中使用的未知单词

因此,在Keras IMDB数据集中,“2”用于表示未知单词,而不是“0”。

今天感谢您的编辑和回答。嗯,我在加载的数据中根本看不到“0”;Keras的
load_data
真的在填充吗?@rishai不,数据没有被填充。因为这是最终用户决定做或不做的事情,取决于任务/方法。