Csv 使用awk和cut时,带有逗号分隔符的文件不能提供正确的结果

Csv 使用awk和cut时,带有逗号分隔符的文件不能提供正确的结果,csv,awk,cut,Csv,Awk,Cut,我有一个以逗号作为分隔符的.csv文件,它有600个字段,当我尝试在excel中打开该文件时,字段531有一个值,但当我尝试使用cut和awk命令从linux中提取数据时,它没有给精确的数据任何建议 文件格式:92b-a727-6fbc59a453a6”“,”“,”“be41bbe6-f813-4”“,”“,”“,”“,”“,”“ 在Excel中打开时,字段531显示为: 25e9417a-bc84-4a32-bc42-95ca70dce112 124e8d11-3326-41f1-9b

我有一个以逗号作为分隔符的.csv文件,它有600个字段,当我尝试在excel中打开该文件时,字段531有一个值,但当我尝试使用cut和awk命令从linux中提取数据时,它没有给精确的数据任何建议

文件格式:
92b-a727-6fbc59a453a6”“,”“,”“be41bbe6-f813-4”“,”“,”“,”“,”“,”“

在Excel中打开时,字段531显示为:

25e9417a-bc84-4a32-bc42-95ca70dce112    
124e8d11-3326-41f1-9b1a-7258332bd493    
f2c98d41-daa5-423f-82ee-787e4f64dfe8    
be41bbe6-f813-492b-a727-6fbc59a453a6    
a1ef5423-93d7-4cf4-ba37-2eb2cb4a7611    
d12116e4-3427-4139-8d7c-41947e8534cc
当尝试使用命令“
cut-d”、“-f531”或“awk-F”时,“{print$531}”

""
united states"
""
"be41bbe6-f813-492b-a727-6fbc59a453a6"
"a1ef5423-93d7-4cf4-ba37-2eb2cb4a7611"
"d12116e4-3427-4139-8d7c-41947e8534cc"
请建议


我甚至将“
”替换为
|
,并尝试使用cut和awk提取仍然相同的结果

可能在某些字段中嵌入了逗号。如果运行
awk-F,“{print NF}”'file | sort-u
并查看大于600的数字输出,这就是问题所在。如果您有gnu awk,您可以在这里尝试
FPAT
解决方案:如果您使用sed/awk进行全局替换,那么您还更改了“嵌入式”
类似于美国IL的
。您需要使用
|
作为字段分隔符从Excel导出,然后您的代码就可以工作了请看@jas的评论。祝你好运。我试图访问的文件有数百万个记录,最小文件大小为25gb