将JSON拆分为多个文件
我从mongodb导出了json文件,如下所示:将JSON拆分为多个文件,json,shell,awk,jq,Json,Shell,Awk,Jq,我从mongodb导出了json文件,如下所示: {"_id":"99919","city":"THORNE BAY"} {"_id":"99921","city":"CRAIG"} {"_id":"99922","city":"HYDABURG"} {"_id":"99923","city":"HYDER"} 大约有30000行,我想把每一行分割成它自己的.json文件。(我正在尝试将数据传输到couchbase群集) 我试着这样做: cat cities.json | jq -c -M '
{"_id":"99919","city":"THORNE BAY"}
{"_id":"99921","city":"CRAIG"}
{"_id":"99922","city":"HYDABURG"}
{"_id":"99923","city":"HYDER"}
大约有30000行,我想把每一行分割成它自己的.json
文件。(我正在尝试将数据传输到couchbase群集)
我试着这样做:
cat cities.json | jq -c -M '.' | \
while read line; do echo $line > .chunks/cities_$(date +%s%N).json; done
但是我发现它似乎减少了行的负载,并且运行这个命令的输出只给了我50多个文件,而我预期的是30000多个
有没有一种合乎逻辑的方法可以使它不使用任何适合的东西删除任何数据?假设您不关心确切的文件名,如果您想将输入拆分为多个文件,只需使用
jq-c.
通常,在任何UNIX系统上使用任何awk将任何文本文件拆分为每行单独的文件只需:
awk '{close(f); f=".chunks/cities_"NR".json"; print > f}' cities.json
不太有效我得到了
拆分:非法选项--
:(为osx解决了这个问题,您需要安装coreutils:brew安装coreutils
。然后使用gsplit
而不是拆分
:)如果您真的不关心输出文件名,gsplit
仅对--附加后缀
选项是必需的。BSD日期
不支持%N
作为几分之一秒。因为每秒只生成一次唯一的输出文件名,并且每秒处理的行远远不止一行,所以正在丢失行。
awk '{close(f); f=".chunks/cities_"NR".json"; print > f}' cities.json