为下游应用程序写入HDFS时JSON与CSV文件格式的优点

为下游应用程序写入HDFS时JSON与CSV文件格式的优点,json,csv,hadoop,hdfs,bigdata,Json,Csv,Hadoop,Hdfs,Bigdata,我们正在提取源数据(xls)并注入HDFS。以CSV或JSON格式编写这些文件更好吗?我们正在考虑选择其中一个,但在打电话之前,我们想知道使用其中任何一个的优点和缺点是什么 我们试图找出的因素有: 性能(数据量为2-5 GB) 加载与读取数据 从这些文件中提取元数据(结构)信息要容易得多 注入的数据将被支持JSON和CSV的其他应用程序使用

我们正在提取源数据(xls)并注入HDFS。以CSV或JSON格式编写这些文件更好吗?我们正在考虑选择其中一个,但在打电话之前,我们想知道使用其中任何一个的优点和缺点是什么

我们试图找出的因素有:

  • 性能(数据量为2-5 GB)
  • 加载与读取数据
  • 从这些文件中提取元数据(结构)信息要容易得多
注入的数据将被支持JSON和CSV的其他应用程序使用