Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/google-cloud-platform/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Google cloud platform 使用n2-standard-2机器类型运行数据流作业时,数据流作业是否随时仅使用2个vCPU';s或它可以自动缩放到配额限制_Google Cloud Platform_Google Cloud Dataflow - Fatal编程技术网

Google cloud platform 使用n2-standard-2机器类型运行数据流作业时,数据流作业是否随时仅使用2个vCPU';s或它可以自动缩放到配额限制

Google cloud platform 使用n2-standard-2机器类型运行数据流作业时,数据流作业是否随时仅使用2个vCPU';s或它可以自动缩放到配额限制,google-cloud-platform,google-cloud-dataflow,Google Cloud Platform,Google Cloud Dataflow,我有一个关于机器类型的数据流作业的问题。我知道数据流使用默认机器类型作为n1-standard-1进行批处理,我们在asia-south1中有n1机器类型的配额问题。我们被要求改用N2机器类型。因此,在创建数据流模板时,甚至在从cloud shell运行数据流作业时,我将机器类型指定为 python -m <Python script> \ --project <project> \ --region asia-south1 \ --runner DataflowRunn

我有一个关于机器类型的数据流作业的问题。我知道数据流使用默认机器类型作为n1-standard-1进行批处理,我们在asia-south1中有n1机器类型的配额问题。我们被要求改用N2机器类型。因此,在创建数据流模板时,甚至在从cloud shell运行数据流作业时,我将机器类型指定为

python -m <Python script> \
--project <project> \
--region asia-south1 \
--runner DataflowRunner \
--staging_location <staging location> \
--temp_location <temp location> \
--subnetwork <sub network> \
--zone asia-south1-a \
--machine_type n2-standard-2 \
--save_main_session
python-m\
--计划\
--亚洲南部地区1\
--转轮数据流转轮\
--登台地点\
--临时位置\
--子网\
--亚洲南1-a区\
--机器类型n2-standard-2\
--保存主会话
我的理解是,机器类型是数据流在开始工作时使用的类型,但在自动缩放和基于作业的情况下,vCPU的数量可以更多地基于项目配额,现在是32个CPU,数据流作业不会将其限制为仅2个vCPU。如果我的数据流作业在运行时需要4个vCPU,则无论我在运行或创建数据流模板(如n2-standard-2)时提到了什么,都将分配该作业

有人能证实我的理解吗?

在中,您有两个有趣的参数:

  • num_workers
    这是您所需的最小工作人数
  • max\u num\u workers
    您想要的最大工作人数
如果您的机器类型为
n2-standard-2
,并且您的n2 vCPU配额为32,则无法在num_workers参数(最小或最大)中输入超过16个。如果在
max_num_workers
中放入4个,即使项目配额为32个vCPU,管道也只能创建4个n2-standard-2虚拟机,因此最多可以创建8个vCPU


因此,项目配额可以在全局范围内限制您(对于数据流管道,以及其他VM/GKE创建),而
max_num_workers
仅限制当前管道中的工作人员数量(与CPU数量没有直接关系,这取决于机器类型)

非常感谢您的解释。我现在明白了。非常感谢你一如既往的帮助。由于我们不想限制管道现在运行的工人数量,并且它可以根据项目配额扩展到最大工人数量(因为我们启用了自动缩放),因此我将使用n2-standard-2机器类型,而不使用max_num_workers参数。因此,数据流作业将从2个vCPU(一个n2-standard-2)开始,并扩展到32个vCPU(16个n2-standard-2 VM)。如果你认为我还没有弄好,请纠正我。是的,你可以。您应该会在日志中看到错误(由于配额限制导致的扩展问题),但它不会中断您的管道。谢谢@guillaume blaquiere。感谢你的帮助和时间。