Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/joomla/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Machine learning 培训SyntaxNet需要多少数据?_Machine Learning_Training Data_Pos Tagger_Syntaxnet_Dependency Parsing - Fatal编程技术网

Machine learning 培训SyntaxNet需要多少数据?

Machine learning 培训SyntaxNet需要多少数据?,machine-learning,training-data,pos-tagger,syntaxnet,dependency-parsing,Machine Learning,Training Data,Pos Tagger,Syntaxnet,Dependency Parsing,我知道数据越多越好,但训练SyntaxNet所需的合理数据量是多少?基于一些尝试和错误,我得出了以下最低值: 训练语料库-18000个标记(任何小于此值的标记,步骤2-使用标记器进行预处理-失败) 测试语料库-2000个标记(小于此值的任何内容,步骤2-使用标记器进行预处理-失败) 开发文集-2000代币 但是请注意,有了这个,我只设法让NLP管道中的步骤运行,实际上我还没有设法从中得到任何有用的东西

我知道数据越多越好,但训练SyntaxNet所需的合理数据量是多少?

基于一些尝试和错误,我得出了以下最低值:
  • 训练语料库-18000个标记(任何小于此值的标记,步骤2-使用标记器进行预处理-失败)
  • 测试语料库-2000个标记(小于此值的任何内容,步骤2-使用标记器进行预处理-失败)
  • 开发文集-2000代币

    但是请注意,有了这个,我只设法让NLP管道中的步骤运行,实际上我还没有设法从中得到任何有用的东西