Python Keras IMDB数据集0与ovv_字符
我正在查看的文档中显示: 按照惯例,“0”并不代表特定的单词,而是用于对任何未知单词进行编码 但是,当我尝试以下操作时,在数据中看不到“0”:Python Keras IMDB数据集0与ovv_字符,python,tensorflow,keras,Python,Tensorflow,Keras,我正在查看的文档中显示: 按照惯例,“0”并不代表特定的单词,而是用于对任何未知单词进行编码 但是,当我尝试以下操作时,在数据中看不到“0”: (inputTrain, yTrain), (inputTest, yTest) = imdb.load_data(num_words=vocabSize) 我错过什么了吗?我也没有看到在预处理代码中添加“0” 按照惯例,“0”并不代表特定的单词,而是用于对任何未知单词进行编码 这里的文档是错误的。在Keras IMDB数据集中,值: “0”表示填充
(inputTrain, yTrain), (inputTest, yTest) = imdb.load_data(num_words=vocabSize)
我错过什么了吗?我也没有看到在预处理代码中添加“0”
按照惯例,“0”并不代表特定的单词,而是用于对任何未知单词进行编码
这里的文档是错误的。在Keras IMDB数据集中,值:
- “0”表示填充(即使所有序列具有所需的相同长度)
- “1”表示开始标记,即表示文档的开始
- “2”代表OOV(词汇表外)标记,即表示字典中未包含的所有标记,或文档中使用的未知单词
因此,在Keras IMDB数据集中,“2”用于表示未知单词,而不是“0”。今天感谢您的编辑和回答。嗯,我在加载的数据中根本看不到“0”;Keras的
load_data
真的在填充吗?@rishai不,数据没有被填充。因为这是最终用户决定做或不做的事情,取决于任务/方法。