Scala 在烫伤中读取分隔符

Scala 在烫伤中读取分隔符,scala,scalding,Scala,Scalding,我正试图在滚烫中读取一个ctrl-a分隔文件。我得到一个错误,说它找到了错误数量的字段,期望166,找到142,然后它显示了它试图读取的行。由于某些原因,它不会读取文件前三分之一的分隔符。以下是我正在使用的代码: Csv(args("input"), separator = "\u0001", fields = schema) .read .groupBy('var2){group => group.sum[Long]('var3)} .write(Tsv(args

我正试图在滚烫中读取一个ctrl-a分隔文件。我得到一个错误,说它找到了错误数量的字段,期望166,找到142,然后它显示了它试图读取的行。由于某些原因,它不会读取文件前三分之一的分隔符。以下是我正在使用的代码:

Csv(args("input"), separator = "\u0001", fields = schema)
    .read
    .groupBy('var2){group => group.sum[Long]('var3)}
    .write(Tsv(args("output")))

我是烫伤新手,所以可能我使用CSV功能不正确/不适当。关于为什么会发生这种情况,有什么想法吗?

我建议看一看它出错的那一行,看看该字段值中是否嵌入了任何控制字符。
我快速读取了一个由标题开头分隔的文件!!控制字符,我就能很好地阅读。因此,建议查看数据-如果可能,您可以提供样本数据。

选民能否给出一些原因,以便我了解问题所在。头的控制a/开始不是一样的吗?