Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/323.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 集合内的组合_Java_Apache Spark_Apache Spark Sql - Fatal编程技术网

Java 集合内的组合

Java 集合内的组合,java,apache-spark,apache-spark-sql,Java,Apache Spark,Apache Spark Sql,我正在使用JavaSpark2.3.1。 我需要从一组单词中提取单词对,我已经没有主意了。我正在尝试使用JavaSparkAPI来实现尽可能最好的性能 我有以下数据集: +----------------------+ |words

我正在使用JavaSpark2.3.1。 我需要从一组单词中提取单词对,我已经没有主意了。我正在尝试使用JavaSparkAPI来实现尽可能最好的性能

我有以下数据集:

+----------------------+
|words                                                                                                                                                                                                                                                                                                                                                              |
+----------------------+
|[a, b, c, d]                                                                                                                                                                                                                                                                                                                                                      |                                                                                                                                                                                                                                                                                                                                               |
|[m, a, b]         
+----------------------+   
我想要实现的是:

+------+------+
|word a|word b|
+------+------+
|     a|     b|
|     a|     c|
|     a|     d|
|     b|     c|
|     b|     d|
|     c|     d|
|     m|     a|
|     m|     b|
|     a|     b|
+--------------+

非常感谢

您的数据集总是只有两行?不,有很多行。您是否总是将此应用于两行?另外,词集的典型大小是多少?你的最终目标是什么?