Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/css/39.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Nlp 为什么不是所有的数字都用手套表示?_Nlp_Stanford Nlp_Word Embedding - Fatal编程技术网

Nlp 为什么不是所有的数字都用手套表示?

Nlp 为什么不是所有的数字都用手套表示?,nlp,stanford-nlp,word-embedding,Nlp,Stanford Nlp,Word Embedding,并不是所有的数字都在斯坦福大学的单词嵌入框架“手套”中表示。为什么呢 例如,“8900”的矢量表示存在,但“8594”会抛出一个错误。某些数字不表示是否相关?若并没有,你们可以在训练前通过预处理将所有相同的向量赋值给相同的值。也许你们可以自己回答这个问题。你怎么想,为什么“单词”有一个表示法,而不是“wrdlbrmpft”?这是因为它训练的语料库不包含特定的标记。@lenz“wrdlbrmpft”不是英语词汇。这个问题背后的想法是,当不可能训练所有数字时,如何使用手套来处理数字。必须有某种方法来

并不是所有的数字都在斯坦福大学的单词嵌入框架“手套”中表示。为什么呢


例如,“8900”的矢量表示存在,但“8594”会抛出一个错误。

某些数字不表示是否相关?若并没有,你们可以在训练前通过预处理将所有相同的向量赋值给相同的值。

也许你们可以自己回答这个问题。你怎么想,为什么“单词”有一个表示法,而不是“wrdlbrmpft”?这是因为它训练的语料库不包含特定的标记。@lenz“wrdlbrmpft”不是英语词汇。这个问题背后的想法是,当不可能训练所有数字时,如何使用手套来处理数字。必须有某种方法来生成它们的向量。@alvas,谢谢。我也这么想。但是,手套如何对待数字呢?当使用手套处理文本时,如何接近数字?我不认为有不同的类型。都是些代币。“wrdlbrmpft”和“8594”一样,在训练中不太常见。不过,将数字预处理为“0”可能会有所帮助。