Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/sqlite/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Google bigquery 在Bigquery ML中拆分用于训练和评估的数据集_Google Bigquery - Fatal编程技术网

Google bigquery 在Bigquery ML中拆分用于训练和评估的数据集

Google bigquery 在Bigquery ML中拆分用于训练和评估的数据集,google-bigquery,Google Bigquery,BigQuery ML是否自动分割数据集以进行培训和评估?或者我们必须手动获取80%的数据集用于培训,10%用于验证,10%用于逻辑回归BigQuery ML评估? 如果两者都是肯定的,哪一个更好 谢谢是的,BigQuery ML将自动分割数据以进行验证过程。对于您来说,手动拆分保留集以对模型从未见过的数据执行一些额外的验证也是相当常见的做法 您可以使用DATA\u SPLIT\u方法参数告诉BigQuery ML您希望如何分割数据。默认拆分为AUTO_split,其定义如下: 当输入数据中的行

BigQuery ML是否自动分割数据集以进行培训和评估?或者我们必须手动获取80%的数据集用于培训,10%用于验证,10%用于逻辑回归BigQuery ML评估? 如果两者都是肯定的,哪一个更好


谢谢

是的,BigQuery ML将自动分割数据以进行验证过程。对于您来说,手动拆分保留集以对模型从未见过的数据执行一些额外的验证也是相当常见的做法

您可以使用
DATA\u SPLIT\u方法
参数告诉BigQuery ML您希望如何分割数据。默认拆分为
AUTO_split
,其定义如下:

当输入数据中的行数少于500行时,所有行均为空 用作训练数据。当图形中有500到50000行时 在输入数据中,20%的数据作为评估数据随机使用 分裂当输入数据中的行数超过50000行时,仅 其中10000个用作随机拆分的评估数据


有关更多信息,我建议您阅读。

以确认,如果我们输入特定参数(data\u split\u方法),它只会自动分割数据,对吗?如果不输入参数会发生什么?@fokuscocus默认值为“AUTO_SPLIT”。请参见此处的文档: