Java 集合内的组合
我正在使用JavaSpark2.3.1。 我需要从一组单词中提取单词对,我已经没有主意了。我正在尝试使用JavaSparkAPI来实现尽可能最好的性能 我有以下数据集:Java 集合内的组合,java,apache-spark,apache-spark-sql,Java,Apache Spark,Apache Spark Sql,我正在使用JavaSpark2.3.1。 我需要从一组单词中提取单词对,我已经没有主意了。我正在尝试使用JavaSparkAPI来实现尽可能最好的性能 我有以下数据集: +----------------------+ |words
+----------------------+
|words |
+----------------------+
|[a, b, c, d] | |
|[m, a, b]
+----------------------+
我想要实现的是:
+------+------+
|word a|word b|
+------+------+
| a| b|
| a| c|
| a| d|
| b| c|
| b| d|
| c| d|
| m| a|
| m| b|
| a| b|
+--------------+
非常感谢 您的数据集总是只有两行?不,有很多行。您是否总是将此应用于两行?另外,词集的典型大小是多少?你的最终目标是什么?