Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/mercurial/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Google cloud dataflow google云数据流作业中的数据完整性错误_Google Cloud Dataflow - Fatal编程技术网

Google cloud dataflow google云数据流作业中的数据完整性错误

Google cloud dataflow google云数据流作业中的数据完整性错误,google-cloud-dataflow,Google Cloud Dataflow,我注意到我的一个数据流工作产生了输出,我可以用太多的随机位翻转来形容。例如,2014年作为文本写入为0007或2016或0052或其他文本值。在某些情况下,输出行格式是有效的,这表明在处理过程中发生了一些情况,但似乎很少有行具有格式错误,例如20141215-04-25,而不是2014-12-25 我偶尔会用相同的代码和不同的日期范围参数重新运行作业,对于这个特定的日期范围,直到大约一周前作业才成功完成。我一直在尝试不同的机器配置,虽然有4个cpu和1个cpu实例,但问题似乎更多地发生在4个cp

我注意到我的一个数据流工作产生了输出,我可以用太多的随机位翻转来形容。例如,2014年作为文本写入为0007或2016或0052或其他文本值。在某些情况下,输出行格式是有效的,这表明在处理过程中发生了一些情况,但似乎很少有行具有格式错误,例如20141215-04-25,而不是2014-12-25

我偶尔会用相同的代码和不同的日期范围参数重新运行作业,对于这个特定的日期范围,直到大约一周前作业才成功完成。我一直在尝试不同的机器配置,虽然有4个cpu和1个cpu实例,但问题似乎更多地发生在4个cpu实例上

有人知道这是怎么回事吗

谢谢,
G

用户代码中的线程安全问题导致了这种类型的损坏。在使用多核实例进行计算时,可能会发生这种类型的错误。

用户代码中的线程安全问题导致了这种类型的损坏。当使用多核实例进行计算时,可能会发生这种类型的错误。

当使用4-cpu实例时,数据流在单个Java进程中运行多个线程。如果其中一个转换是线程敌对的,那么可能会发生数据损坏,也就是说,多个线程甚至不能安全地访问类的单独实例。这通常发生在类使用静态非线程安全成员变量时。

使用4-cpu实例时,数据流在单个Java进程中运行多个线程。如果其中一个转换是线程敌对的,那么可能会发生数据损坏,也就是说,多个线程甚至不能安全地访问类的单独实例。当类使用静态非线程安全成员变量时,通常会发生这种情况。

Hi G B,让我继续关注这种行为。这显然不是我们想要的行为。我们已经私下要求提供更多信息,并将尽快发布答案。谢谢,G B!嗨,Gb,让我来跟进一下这个行为。这显然不是我们想要的行为。我们已经私下要求提供更多信息,并将尽快发布答案。谢谢,G B!我的代码中的错误:感谢Marian指出了问题所在。有关数据流并发模型的更多信息可在此堆栈溢出中找到。我的代码中的错误:感谢Marian指出了问题所在。有关数据流并发模型的更多信息可在此堆栈溢出中找到