Machine learning 培训SyntaxNet需要多少数据?
我知道数据越多越好,但训练SyntaxNet所需的合理数据量是多少?基于一些尝试和错误,我得出了以下最低值:Machine learning 培训SyntaxNet需要多少数据?,machine-learning,training-data,pos-tagger,syntaxnet,dependency-parsing,Machine Learning,Training Data,Pos Tagger,Syntaxnet,Dependency Parsing,我知道数据越多越好,但训练SyntaxNet所需的合理数据量是多少?基于一些尝试和错误,我得出了以下最低值: 训练语料库-18000个标记(任何小于此值的标记,步骤2-使用标记器进行预处理-失败) 测试语料库-2000个标记(小于此值的任何内容,步骤2-使用标记器进行预处理-失败) 开发文集-2000代币 但是请注意,有了这个,我只设法让NLP管道中的步骤运行,实际上我还没有设法从中得到任何有用的东西