Nlp 为什么不是所有的数字都用手套表示?
并不是所有的数字都在斯坦福大学的单词嵌入框架“手套”中表示。为什么呢Nlp 为什么不是所有的数字都用手套表示?,nlp,stanford-nlp,word-embedding,Nlp,Stanford Nlp,Word Embedding,并不是所有的数字都在斯坦福大学的单词嵌入框架“手套”中表示。为什么呢 例如,“8900”的矢量表示存在,但“8594”会抛出一个错误。某些数字不表示是否相关?若并没有,你们可以在训练前通过预处理将所有相同的向量赋值给相同的值。也许你们可以自己回答这个问题。你怎么想,为什么“单词”有一个表示法,而不是“wrdlbrmpft”?这是因为它训练的语料库不包含特定的标记。@lenz“wrdlbrmpft”不是英语词汇。这个问题背后的想法是,当不可能训练所有数字时,如何使用手套来处理数字。必须有某种方法来
例如,“8900”的矢量表示存在,但“8594”会抛出一个错误。某些数字不表示是否相关?若并没有,你们可以在训练前通过预处理将所有相同的向量赋值给相同的值。也许你们可以自己回答这个问题。你怎么想,为什么“单词”有一个表示法,而不是“wrdlbrmpft”?这是因为它训练的语料库不包含特定的标记。@lenz“wrdlbrmpft”不是英语词汇。这个问题背后的想法是,当不可能训练所有数字时,如何使用手套来处理数字。必须有某种方法来生成它们的向量。@alvas,谢谢。我也这么想。但是,手套如何对待数字呢?当使用手套处理文本时,如何接近数字?我不认为有不同的类型。都是些代币。“wrdlbrmpft”和“8594”一样,在训练中不太常见。不过,将数字预处理为“0”可能会有所帮助。