Java 具有无序终端操作的Stream.skip行为
我已经阅读并提出了一些问题,但仍然怀疑观察到的Java 具有无序终端操作的Stream.skip行为,java,parallel-processing,java-8,java-stream,collectors,Java,Parallel Processing,Java 8,Java Stream,Collectors,我已经阅读并提出了一些问题,但仍然怀疑观察到的Stream.skip行为是否是JDK作者的意图 让我们简单输入数字1..20: List<Integer> input = IntStream.rangeClosed(1, 20).boxed().collect(Collectors.toList()); 过滤步骤在这里基本上什么都不做,但给流引擎增加了更多的困难:现在它不知道输出的确切大小,因此关闭了一些优化。我有以下结果: skip-skip-unordered-toList:
Stream.skip
行为是否是JDK作者的意图
让我们简单输入数字1..20:
List<Integer> input = IntStream.rangeClosed(1, 20).boxed().collect(Collectors.toList());
过滤步骤在这里基本上什么都不做,但给流引擎增加了更多的困难:现在它不知道输出的确切大小,因此关闭了一些优化。我有以下结果:
skip-skip-unordered-toList: [3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20]
// absent values: 1, 2
skip-unordered-skip-toList: [2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 16, 17, 18, 19, 20]
// absent values: 1, 15
unordered-skip-skip-toList: [1, 2, 3, 4, 5, 6, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 19, 20]
// absent values: 7, 18
结果很好,一切正常。在第一种情况下,我要求跳过前两个元素,然后收集并没有特定顺序的列表。在第二种情况下,我要求跳过第一个元素,然后变成无序,再跳过一个元素(我不在乎是哪一个)。在第三种情况下,我首先进入无序模式,然后跳过两个任意元素
让我们跳过一个元素,以无序模式收集到自定义集合。我们的自定义集合将是一个哈希集
:
System.out.println("skip-toCollection: "
+ input.parallelStream().filter(x -> x > 0)
.skip(1)
.unordered()
.collect(Collectors.toCollection(HashSet::new)));
System.out.println("skip-toSet: "
+ input.parallelStream().filter(x -> x > 0)
.skip(1)
.unordered()
.collect(Collectors.toSet()));
结果令人满意:
skip-toCollection: [2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20]
// 1 is skipped
所以一般来说,我希望只要流是有序的,skip()
跳过第一个元素,否则它跳过任意元素
但是,让我们使用等效的无序终端操作collect(Collectors.toSet())
:
现在输出为:
skip-toSet: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 17, 18, 19, 20]
// 13 is skipped
任何其他无序终端操作(如forEach
、findAny
、anyMatch
等)都可以获得相同的结果。在这种情况下,删除unordered()
步骤不会改变任何内容。似乎当unordered()
步骤正确地使流从当前操作开始无序时,unordered terminal操作使整个流从一开始就无序,尽管如果使用skip()
,这可能会影响结果。这似乎完全误导了我:我认为使用无序收集器与在终端操作之前将流转换为无序模式并使用等效的有序收集器是一样的
因此,我的问题是:
unordered()
step仅从这一点开始使其无序?我能相信这种行为吗?或者我只是很幸运我的第一次测试很顺利 System.out.println("skip-toSet: "
+ input.parallelStream().filter(x -> x > 0)
.skip(1)
.collect(Collectors.toSet()));
此外,Stream中的skip()方法给了我们一个提示:
而{@code skip()}通常是一种廉价的顺序操作
流管道,它可以是相当昂贵的有序并行
管道
及
使用无序流源(例如{@link#generate(Supplier)})
或者使用{@link#unordered()}删除排序约束可能会
导致显著的加速
使用时
Collectors.toCollection(HashSet::new)
您正在创建一个正常的“有序”收集器(一个没有无序特征的收集器),对我来说,这意味着您确实关心排序,因此,元素是按顺序提取的,您可以获得预期的行为。回想一下流标志的目标(有序、排序、大小、不同)是为了使操作避免做不必要的工作。涉及流标志的优化示例包括:
- 如果我们知道流已经排序,那么
是不可操作的李>sorted()
- 如果我们知道流的大小,我们可以在
中预先分配一个大小正确的数组,避免复制李>toArray()
- 如果我们知道输入没有有意义的遭遇顺序,我们就不需要采取额外的步骤来保持遭遇顺序
Collectors.toCollection(HashSet::new)
set.stream()
.sorted()
.forEach(System.out::println);