Nlp 如何限制FastText中的字长?

Nlp 如何限制FastText中的字长?,nlp,word2vec,fasttext,Nlp,Word2vec,Fasttext,我使用FastText在一个包含一长串没有空格的字符的语料库上计算skipgrams。大约一小时后,FastText生成一个模型,其中包含长度为100的向量,对应于语料库中长度为50个字符的单词 我试着设置-minn和-maxn参数,但这并没有帮助,我知道这不会,但还是尝试了,而且-wordNgrams参数只适用于有空格的情况,我猜?!。这只是一个表示状态的长字符流,没有空格 文档中似乎没有关于这方面的任何信息,或者我遗漏了什么?该工具只接受您提供的任何空格分隔的标记 如果要截断或丢弃长度超过5

我使用FastText在一个包含一长串没有空格的字符的语料库上计算skipgrams。大约一小时后,FastText生成一个模型,其中包含长度为100的向量,对应于语料库中长度为50个字符的单词

我试着设置-minn和-maxn参数,但这并没有帮助,我知道这不会,但还是尝试了,而且-wordNgrams参数只适用于有空格的情况,我猜?!。这只是一个表示状态的长字符流,没有空格


文档中似乎没有关于这方面的任何信息,或者我遗漏了什么?

该工具只接受您提供的任何空格分隔的标记

如果要截断或丢弃长度超过50个字符或任何其他阈值的标记,则需要自己对数据进行预处理


如果您的问题实际上是其他问题,请在问题中添加更多细节,显示语料库中的示例行、您如何调用fasttext、您如何查看不满意的结果,以及您希望得到满意的结果。

是的,我想我必须在调用fasttext之前对文本进行预处理。谢谢