Scala:如何将ByteArray的长度以及ByteArray本身写入序列文件?
我有一个HDFS文件,它有几个记录Scala:如何将ByteArray的长度以及ByteArray本身写入序列文件?,scala,apache-spark,Scala,Apache Spark,我有一个HDFS文件,它有几个记录 我希望能够写出每个记录的大小,然后是记录本身 如何执行上述操作,然后saveAsSequenceFile 注意:记录采用byteArray格式请用您迄今为止尝试的内容更新问题。每行记录一条?是否要逐行读取HDFS上的文件,然后将输出另存为length(line),line?
saveAsSequenceFile
注意:记录采用byteArray格式请用您迄今为止尝试的内容更新问题。每行记录一条?是否要逐行读取HDFS上的文件,然后将输出另存为
length(line),line
?