Logging 在记录数据时使用json编码好吗?

Logging 在记录数据时使用json编码好吗?,logging,encoding,Logging,Encoding,我必须记录大量数据,稍后将对其进行分析。我目前没有分析它。稍后我们将使用Hadoop对其进行分析。怎样我不知道。但原木的尺寸太大了 因此,我正在寻找一个格式,它将采取较小的规模,并将很容易分析以后 我曾想过将其保存为分隔值,但日志可能包含逗号和换行符。然后我考虑使用JSON对其进行编码,或者将每个字段都设置为BASE64编码。但我不知道我们以后是否能对它进行分析 我应该使用什么样的日志格式,以便以后更容易分析?CSV允许您转义数据,如: 1,2,"value with, comma","valu

我必须记录大量数据,稍后将对其进行分析。我目前没有分析它。稍后我们将使用Hadoop对其进行分析。怎样我不知道。但原木的尺寸太大了

因此,我正在寻找一个格式,它将采取较小的规模,并将很容易分析以后

我曾想过将其保存为分隔值,但日志可能包含逗号和换行符。然后我考虑使用JSON对其进行编码,或者将每个字段都设置为BASE64编码。但我不知道我们以后是否能对它进行分析


我应该使用什么样的日志格式,以便以后更容易分析?

CSV允许您转义数据,如:

1,2,"value with, comma","value with
newline","value with "" quote"
1,2,"foo","bar","baz"
所以逗号或换行符应该没有问题。写入文件时使用

CSV可能使您获得最小的文件大小,因为分隔符开销最小


如果空间是一个问题,你可以随时只gzip压缩文件



Base64通常会将数据膨胀约33%

CSV允许您转义数据,如:

1,2,"value with, comma","value with
newline","value with "" quote"
1,2,"foo","bar","baz"
所以逗号或换行符应该没有问题。写入文件时使用

CSV可能使您获得最小的文件大小,因为分隔符开销最小


如果空间是一个问题,你可以随时只gzip压缩文件



Base64通常会将数据膨胀约33%

,只要您使用结构良好的格式字符串生成日志语句,您应该能够在以后有效地解析它;可能使用正则表达式


JSON将使您的日志膨胀得可怕,并且不会提高您解析日志的能力。唯一有意义的场景是您需要在日志中转储对象。

只要您使用结构良好的格式字符串生成日志语句,您应该能够在以后有效地解析它;可能使用正则表达式


JSON将使您的日志膨胀得可怕,并且不会提高您解析日志的能力。唯一有意义的场景是您需要在日志中转储对象。

正如www.qubole.com的一位工程师所建议的那样。我使用csv格式,因为当使用JSON编码行时,使用hadoop查询TB的日志文件更昂贵(耗时)。

正如www.qubole.com的一位工程师所建议的那样。我使用csv格式,因为在使用JSON编码行时,使用hadoop查询TB的日志文件更昂贵(耗时)。

为什么标记为PHP和Go?为什么标记为PHP和Go?