Java 如何在Spark中的每个执行器之间生成不同的随机值?
我不确定这是否可行,但想问问社区 我生成一个随机字符串,然后使用这个值在XML文件中创建一个标记。我有两种方法可以做到这一点。要么在调用map partition之前生成随机值,然后所有xml都具有相同的值,要么在map partition中创建随机值,从而为每个xml生成不同的值Java 如何在Spark中的每个执行器之间生成不同的随机值?,java,apache-spark,Java,Apache Spark,我不确定这是否可行,但想问问社区 我生成一个随机字符串,然后使用这个值在XML文件中创建一个标记。我有两种方法可以做到这一点。要么在调用map partition之前生成随机值,然后所有xml都具有相同的值,要么在map partition中创建随机值,从而为每个xml生成不同的值 我想知道是否有一种方法,如果为每个执行者生成一个随机值,然后分配给该执行者的所有任务都使用该值。因此,我将为n执行器(即,10个执行器实例==10个随机值)提供n随机值您是否尝试过单调递增\u id?我不想在这里使用
我想知道是否有一种方法,如果为每个执行者生成一个随机值,然后分配给该执行者的所有任务都使用该值。因此,我将为
n
执行器(即,10个执行器实例==10个随机值)提供n
随机值您是否尝试过单调递增\u id
?我不想在这里使用任何spark函数。我有一个自定义的随机字符串生成器您是否尝试使用sc.statusTracker.getExecutionInfos
获取执行者的数量,并创建一个使用此返回数字的方法?使用SparkEnv.get().ExecutionId()
在映射分区内实现解决方案您是否尝试过单调地增加id?我不想在这里使用任何spark函数。我有一个自定义的随机字符串生成器您是否尝试使用sc.statusTracker.getExecutionInfos
获取执行者的数量,并创建一个使用此返回数字的方法?在映射分区内使用SparkEnv.get().ExecutionId()
来实现解决方案