R 在Linux中解压然后读取未知格式的数据
我正在一台运行Zorin的机器上工作,Zorin是我认为属于Ubuntu家族的Linux发行版。我下载了许多数据文件,只是为了获得一些处理数据的经验,我正在尝试将它们导入R。这些文件位于以下页面: 在每种情况下,我都会遇到一个我不熟悉的文件扩展名,我不知道如何使用它们中的任何一个。我试着研究最后一个,其中许多是以.data文件扩展名出现的,我发现另一个人也有类似的问题,但那个人的信息是用某种ASCII编码的。当我在一个简单的文本编辑器中查看.data文件时,它们都是0和1,只有一个空格。也许这是另一种编码,或者这是“二进制” 在任何情况下,我都想知道,在处理数据时,人们应该如何处理各种各样的文件类型。网页上说: 对于EconData: 解压它并使用Inforum的数据库和回归包G 访问该数据。” 我快速查看了一组文件,我怀疑除了“G”以外的任何东西都不会在不做大量工作的情况下读入它们。其中一个文件是二进制数据文件,它可能有一个简单的结构,但很难计算出来。可能“G”有一个“导出”功能,可以编写简单的文本文件,但我没有运行Windows,所以无法轻松运行它 至于其他源,您需要尽可能多地读取可用元数据,或者从扩展名推断元数据,或者查看unix“file”命令告诉您的内容。例如,DISTRIBUTION.Z文件:R 在Linux中解压然后读取未知格式的数据,r,linux,import,R,Linux,Import,我正在一台运行Zorin的机器上工作,Zorin是我认为属于Ubuntu家族的Linux发行版。我下载了许多数据文件,只是为了获得一些处理数据的经验,我正在尝试将它们导入R。这些文件位于以下页面: 在每种情况下,我都会遇到一个我不熟悉的文件扩展名,我不知道如何使用它们中的任何一个。我试着研究最后一个,其中许多是以.data文件扩展名出现的,我发现另一个人也有类似的问题,但那个人的信息是用某种ASCII编码的。当我在一个简单的文本编辑器中查看.data文件时,它们都是0和1,只有一个空格。也
$ file DISTRIBUTION.Z
DISTRIBUTION.Z: compress'd data 16 bits
好的,这是一个“压缩”文件。我们使用解压:
$ uncompress DISTRIBUTION.Z
这给了我们:
$ file DISTRIBUTION
DISTRIBUTION: tar archive
我们提取的tar存档:
$ tar xvf DISTRIBUTION
distribution/
distribution/DOCUMENTATION
distribution/THEORY
distribution/attributes.fr
[etc]
一般来说,了解如何阅读给定的数据集需要直觉、经验、阅读文档、询问搜索引擎或论坛,有时还需要放弃并用头撞墙一个小时。网页上说:
对于EconData:
解压它并使用Inforum的数据库和回归包G
访问该数据。”
我快速查看了一组文件,我怀疑除了“G”以外的任何东西都不会在不做大量工作的情况下读入它们。其中一个文件是二进制数据文件,它可能有一个简单的结构,但很难计算出来。可能“G”有一个“导出”功能,可以编写简单的文本文件,但我没有运行Windows,所以无法轻松运行它
至于其他源,您需要尽可能多地读取可用元数据,或者从扩展名推断元数据,或者查看unix“file”命令告诉您的内容。例如,DISTRIBUTION.Z文件:
$ file DISTRIBUTION.Z
DISTRIBUTION.Z: compress'd data 16 bits
好的,这是一个“压缩”文件。我们使用解压:
$ uncompress DISTRIBUTION.Z
这给了我们:
$ file DISTRIBUTION
DISTRIBUTION: tar archive
我们提取的tar存档:
$ tar xvf DISTRIBUTION
distribution/
distribution/DOCUMENTATION
distribution/THEORY
distribution/attributes.fr
[etc]
一般来说,了解如何阅读给定的数据集需要直觉、经验、阅读文档、询问搜索引擎或论坛,有时还需要放弃并用头撞墙一个小时。我们确实生活在最糟糕的世界中。还是要谢谢你的帮助!我们确实生活在最糟糕的世界里。还是要谢谢你的帮助!