正在提取Csv.gz文件,然后将其导入Excel/SPSS…识别文本限定符时出现问题?

正在提取Csv.gz文件,然后将其导入Excel/SPSS…识别文本限定符时出现问题?,excel,csv,import,spss,gzip,Excel,Csv,Import,Spss,Gzip,我正在使用Insideairbnb.com的一个文件来写我的论文。它是一个csv.gz文件,所以首先我使用Mac的“归档实用程序”提取了它 它是逗号分隔的,并使用双引号作为文本限定符,我在导入弹出窗口中指定了该限定符,但Excel/SPSS仍然在文本中的逗号处进行分隔 这是一个大文件,包括完整的airbnb描述和评论,包含在双引号中。不幸的是,文本字符串中有许多逗号。我从未见过这种格式的csv文件,但我相信它放在一起是正确的,因为我在相当多的学术文章中看到Insideairbnb引用数据 我在S

我正在使用Insideairbnb.com的一个文件来写我的论文。它是一个csv.gz文件,所以首先我使用Mac的“归档实用程序”提取了它

它是逗号分隔的,并使用双引号作为文本限定符,我在导入弹出窗口中指定了该限定符,但Excel/SPSS仍然在文本中的逗号处进行分隔

这是一个大文件,包括完整的airbnb描述和评论,包含在双引号中。不幸的是,文本字符串中有许多逗号。我从未见过这种格式的csv文件,但我相信它放在一起是正确的,因为我在相当多的学术文章中看到Insideairbnb引用数据

我在SPSS导入窗口中包含了一个指向数据片段图片的链接。如果有人知道如何导入此内容,我将非常感谢您的反馈:)

提前谢谢你

[[1]:屏幕截图]
[1] :截图2][1]

我同意@sarawhite的上述评论;如果这是一个一次性的问题,我会尝试一些方法

  • 在excel中打开.csv,如果看起来正确,请保存它,然后重试 将其导入SPSS,或另存为.xlsx文件并导入该文件 (尽管两种语言中的字符串变量都可能是无意义的 (场景)
  • 在notepad++中打开并查看原始数据。你可以找到并替换 双线很容易断

  • 我昨天将数据复制粘贴到Notepad++中,然后将其转换为ANSI并将粘贴的数据复制回Excel。昨天,它起作用了,但今天它不


    无论如何,也许对有同样问题的人是有帮助的。我将稍后再试。

    我不确定屏幕截图是否正确连接。至少,我看不到。你能再描述一下你到目前为止所做的尝试,以及你所犯的错误吗?它是否拒绝导入,或者生成的数据没有按应有的方式分离?谢谢您让我知道!我重新附加了图像链接。它导入了数据,但是评论中的文本在每个逗号后都会被分离到一个新的单元格中。还有许多空行和单元格缺少数据。我想这可能是因为在最初的CSV上,它被组织成类似于带分页符的小段落。我对Insideairbnb.com的数据也有同样的问题,我的论文也是如此。如果可能的话,你能分享你的解决方案吗?