Scala 如何使用Spark向记录添加新内容
我有一个文本文件,其中包含以下几条记录:Scala 如何使用Spark向记录添加新内容,scala,apache-spark,Scala,Apache Spark,我有一个文本文件,其中包含以下几条记录: aaaaa bbbbb ccccc 我想在每条记录前面添加一个字符串(例如“record:”),这样每条记录都会像: record:aaaaa record:bbbbb record:ccccc 我有读取此文本文件并为此文件创建RDD的代码: val aRdd = sc.textFile("/tmp/myFile") 如何使用Spark将字符串添加到此RDD中的每条记录?非常感谢。使用RDD.map: val rddWithRecor
aaaaa
bbbbb
ccccc
我想在每条记录前面添加一个字符串(例如“record:”),这样每条记录都会像:
record:aaaaa
record:bbbbb
record:ccccc
我有读取此文本文件并为此文件创建RDD的代码:
val aRdd = sc.textFile("/tmp/myFile")
如何使用Spark将字符串添加到此RDD中的每条记录?非常感谢。使用
RDD.map
:
val rddWithRecord = sc.textFile("/tmp/myFile").map(currentWord => s"record:$currentWord")
rddWithRecord.print()
通过使用
RDD.map
:
val rddWithRecord = sc.textFile("/tmp/myFile").map(currentWord => s"record:$currentWord")
rddWithRecord.print()
谢谢你的回复谢谢你的回复