Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Scala 如何使用Spark向记录添加新内容_Scala_Apache Spark - Fatal编程技术网

Scala 如何使用Spark向记录添加新内容

Scala 如何使用Spark向记录添加新内容,scala,apache-spark,Scala,Apache Spark,我有一个文本文件,其中包含以下几条记录: aaaaa bbbbb ccccc 我想在每条记录前面添加一个字符串(例如“record:”),这样每条记录都会像: record:aaaaa record:bbbbb record:ccccc 我有读取此文本文件并为此文件创建RDD的代码: val aRdd = sc.textFile("/tmp/myFile") 如何使用Spark将字符串添加到此RDD中的每条记录?非常感谢。使用RDD.map: val rddWithRecor

我有一个文本文件,其中包含以下几条记录:

 aaaaa
 bbbbb
 ccccc
我想在每条记录前面添加一个字符串(例如“record:”),这样每条记录都会像:

 record:aaaaa
 record:bbbbb
 record:ccccc
我有读取此文本文件并为此文件创建RDD的代码:

 val aRdd = sc.textFile("/tmp/myFile")

如何使用Spark将字符串添加到此RDD中的每条记录?非常感谢。

使用
RDD.map

val rddWithRecord = sc.textFile("/tmp/myFile").map(currentWord => s"record:$currentWord")
rddWithRecord.print()

通过使用
RDD.map

val rddWithRecord = sc.textFile("/tmp/myFile").map(currentWord => s"record:$currentWord")
rddWithRecord.print()

谢谢你的回复谢谢你的回复