Google bigquery 如何使用BigQuery ML显式拆分数据以进行培训和评估?

Google bigquery 如何使用BigQuery ML显式拆分数据以进行培训和评估?,google-bigquery,Google Bigquery,我知道已经有了,但它有点老了,不能真正回答问题 我知道我们可以使用参数数据分割方法来分离数据集进行培训和评估。但是我如何确保它们都是不同的数据集呢 例如,我将DATA_SPLIT_METHOD设置为AUTO_SPLIT,我的数据集在500到500k行之间,因此20%的数据将用作评估。当我运行评估(ML.EVALUATE)时,如何确保剩余的80%将用于培训?简短的回答是BigQuery为您做这件事 很长的答案是,调用该参数时,该参数将使用DATA_SPLIT_方法设置的正确百分比创建和训练模型 当

我知道已经有了,但它有点老了,不能真正回答问题

我知道我们可以使用参数数据分割方法来分离数据集进行培训和评估。但是我如何确保它们都是不同的数据集呢


例如,我将DATA_SPLIT_METHOD设置为AUTO_SPLIT,我的数据集在500到500k行之间,因此20%的数据将用作评估。当我运行评估(ML.EVALUATE)时,如何确保剩余的80%将用于培训?

简短的回答是BigQuery为您做这件事

很长的答案是,调用该参数时,该参数将使用DATA_SPLIT_方法设置的正确百分比创建和训练模型

当您运行ML.EVALUATE时,您将为将DATA_SPLIT_方法作为参数的模型运行它。因此,它已经知道必须对数据集的哪一部分进行求值,并使用已训练好的模型