Google cloud dataflow google云数据流作业中的数据完整性错误
我注意到我的一个数据流工作产生了输出,我可以用太多的随机位翻转来形容。例如,2014年作为文本写入为0007或2016或0052或其他文本值。在某些情况下,输出行格式是有效的,这表明在处理过程中发生了一些情况,但似乎很少有行具有格式错误,例如20141215-04-25,而不是2014-12-25 我偶尔会用相同的代码和不同的日期范围参数重新运行作业,对于这个特定的日期范围,直到大约一周前作业才成功完成。我一直在尝试不同的机器配置,虽然有4个cpu和1个cpu实例,但问题似乎更多地发生在4个cpu实例上 有人知道这是怎么回事吗 谢谢,Google cloud dataflow google云数据流作业中的数据完整性错误,google-cloud-dataflow,Google Cloud Dataflow,我注意到我的一个数据流工作产生了输出,我可以用太多的随机位翻转来形容。例如,2014年作为文本写入为0007或2016或0052或其他文本值。在某些情况下,输出行格式是有效的,这表明在处理过程中发生了一些情况,但似乎很少有行具有格式错误,例如20141215-04-25,而不是2014-12-25 我偶尔会用相同的代码和不同的日期范围参数重新运行作业,对于这个特定的日期范围,直到大约一周前作业才成功完成。我一直在尝试不同的机器配置,虽然有4个cpu和1个cpu实例,但问题似乎更多地发生在4个cp
G用户代码中的线程安全问题导致了这种类型的损坏。在使用多核实例进行计算时,可能会发生这种类型的错误。用户代码中的线程安全问题导致了这种类型的损坏。当使用多核实例进行计算时,可能会发生这种类型的错误。当使用4-cpu实例时,数据流在单个Java进程中运行多个线程。如果其中一个转换是线程敌对的,那么可能会发生数据损坏,也就是说,多个线程甚至不能安全地访问类的单独实例。这通常发生在类使用静态非线程安全成员变量时。使用4-cpu实例时,数据流在单个Java进程中运行多个线程。如果其中一个转换是线程敌对的,那么可能会发生数据损坏,也就是说,多个线程甚至不能安全地访问类的单独实例。当类使用静态非线程安全成员变量时,通常会发生这种情况。Hi G B,让我继续关注这种行为。这显然不是我们想要的行为。我们已经私下要求提供更多信息,并将尽快发布答案。谢谢,G B!嗨,Gb,让我来跟进一下这个行为。这显然不是我们想要的行为。我们已经私下要求提供更多信息,并将尽快发布答案。谢谢,G B!我的代码中的错误:感谢Marian指出了问题所在。有关数据流并发模型的更多信息可在此堆栈溢出中找到。我的代码中的错误:感谢Marian指出了问题所在。有关数据流并发模型的更多信息可在此堆栈溢出中找到