Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/variables/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Variables Vowpal Wabbit-使用选项--keep指定命名空间的全名_Variables_Namespaces_Vowpalwabbit - Fatal编程技术网

Variables Vowpal Wabbit-使用选项--keep指定命名空间的全名

Variables Vowpal Wabbit-使用选项--keep指定命名空间的全名,variables,namespaces,vowpalwabbit,Variables,Namespaces,Vowpalwabbit,我必须解决以下情况:调用Vowpal Wabbit在数据集上训练它时,我希望保留特定的名称空间 “--keep”选项将命名空间的第一个字母作为参数但是如果两个名称空间以同一个字母开头,而我只想保留其中一个怎么办? 1.00 | A1 var1 var2 | A2 var3 var4 vw train_data.vw——保留“A1”==>不可能,因为保留只需要一个字符 一个“肮脏”的解决方案是重命名每个名称空间,使它们都以不同的字母开头,但这对我来说是不可能的,因为我需要为每个变量创建一个名称空间

我必须解决以下情况:调用Vowpal Wabbit在数据集上训练它时,我希望保留特定的名称空间

“--keep”选项将命名空间的第一个字母作为参数但是如果两个名称空间以同一个字母开头,而我只想保留其中一个怎么办?

1.00 | A1 var1 var2 | A2 var3 var4

vw train_data.vw——保留“A1”==>不可能,因为保留只需要一个字符

一个“肮脏”的解决方案是重命名每个名称空间,使它们都以不同的字母开头,但这对我来说是不可能的,因为我需要为每个变量创建一个名称空间,而且变量比字母表中的字母多得多


如何解决这个问题?

名称空间可以有更长的名称,但只有名称的第一个字母与选项相关,如
--keep
--ignore
-q
--cubic
等。这是由当前的Vowpal Wabbit(type
char
)实现强制实现的未来也不太可能改变。我建议只使用一个字母的名称空间名称

对于名称空间名称,可以同时使用小写和大写字母以及代码小于256的其他可打印符号。
您不能使用代码<32(不可打印)、32(空格)、58(冒号)、124(管道)和126–135(中保留)的符号,但仍应使用200多个符号。

为什么强制使用字符类型,而不是字符*?我只是好奇导致这种设计的原因。我正在写一个活页夹R-Wabbit来做广义线性模型。我希望保留R的自然语法,从而能够保留或删除VW中的特定变量(R中不使用名称空间)。我发现的一个解决方案是为每个变量(变量的名称)关联一个名称空间,但它有问题,因为两个变量很容易有相同的第一个字母。我正在处理的数据集很容易就有1000多个变量。。。因此,200是不够的。大量的VW代码需要在所有名称空间上迭代(好吧,有时只在非空名称空间上迭代),因此拥有大量名称空间会显著降低VW的速度。另外,不太可能有人指定超过200个
——在命令行上手动保留
选项。您可以使用
--feature\u mask
仅保留模型中指定的功能。您可以指定十六进制字符,因此您有256个名称空间。然后,您可以使用“重定义”按自己的意愿对功能进行分组。(未测试!)