R 在Linux中解压然后读取未知格式的数据

R 在Linux中解压然后读取未知格式的数据,r,linux,import,R,Linux,Import,我正在一台运行Zorin的机器上工作,Zorin是我认为属于Ubuntu家族的Linux发行版。我下载了许多数据文件,只是为了获得一些处理数据的经验,我正在尝试将它们导入R。这些文件位于以下页面: 在每种情况下,我都会遇到一个我不熟悉的文件扩展名,我不知道如何使用它们中的任何一个。我试着研究最后一个,其中许多是以.data文件扩展名出现的,我发现另一个人也有类似的问题,但那个人的信息是用某种ASCII编码的。当我在一个简单的文本编辑器中查看.data文件时,它们都是0和1,只有一个空格。也

我正在一台运行Zorin的机器上工作,Zorin是我认为属于Ubuntu家族的Linux发行版。我下载了许多数据文件,只是为了获得一些处理数据的经验,我正在尝试将它们导入R。这些文件位于以下页面:

在每种情况下,我都会遇到一个我不熟悉的文件扩展名,我不知道如何使用它们中的任何一个。我试着研究最后一个,其中许多是以.data文件扩展名出现的,我发现另一个人也有类似的问题,但那个人的信息是用某种ASCII编码的。当我在一个简单的文本编辑器中查看.data文件时,它们都是0和1,只有一个空格。也许这是另一种编码,或者这是“二进制”

在任何情况下,我都想知道,在处理数据时,人们应该如何处理各种各样的文件类型。

网页上说: 对于EconData:

解压它并使用Inforum的数据库和回归包G 访问该数据。”

我快速查看了一组文件,我怀疑除了“G”以外的任何东西都不会在不做大量工作的情况下读入它们。其中一个文件是二进制数据文件,它可能有一个简单的结构,但很难计算出来。可能“G”有一个“导出”功能,可以编写简单的文本文件,但我没有运行Windows,所以无法轻松运行它

至于其他源,您需要尽可能多地读取可用元数据,或者从扩展名推断元数据,或者查看unix“file”命令告诉您的内容。例如,DISTRIBUTION.Z文件:

$ file DISTRIBUTION.Z 
DISTRIBUTION.Z: compress'd data 16 bits
好的,这是一个“压缩”文件。我们使用
解压

$ uncompress DISTRIBUTION.Z 
这给了我们:

$ file DISTRIBUTION 
DISTRIBUTION: tar archive
我们提取的tar存档:

$ tar xvf DISTRIBUTION
distribution/
distribution/DOCUMENTATION
distribution/THEORY
distribution/attributes.fr
[etc]
一般来说,了解如何阅读给定的数据集需要直觉、经验、阅读文档、询问搜索引擎或论坛,有时还需要放弃并用头撞墙一个小时。

网页上说: 对于EconData:

解压它并使用Inforum的数据库和回归包G 访问该数据。”

我快速查看了一组文件,我怀疑除了“G”以外的任何东西都不会在不做大量工作的情况下读入它们。其中一个文件是二进制数据文件,它可能有一个简单的结构,但很难计算出来。可能“G”有一个“导出”功能,可以编写简单的文本文件,但我没有运行Windows,所以无法轻松运行它

至于其他源,您需要尽可能多地读取可用元数据,或者从扩展名推断元数据,或者查看unix“file”命令告诉您的内容。例如,DISTRIBUTION.Z文件:

$ file DISTRIBUTION.Z 
DISTRIBUTION.Z: compress'd data 16 bits
好的,这是一个“压缩”文件。我们使用
解压

$ uncompress DISTRIBUTION.Z 
这给了我们:

$ file DISTRIBUTION 
DISTRIBUTION: tar archive
我们提取的tar存档:

$ tar xvf DISTRIBUTION
distribution/
distribution/DOCUMENTATION
distribution/THEORY
distribution/attributes.fr
[etc]

一般来说,了解如何阅读给定的数据集需要直觉、经验、阅读文档、询问搜索引擎或论坛,有时还需要放弃并用头撞墙一个小时。

我们确实生活在最糟糕的世界中。还是要谢谢你的帮助!我们确实生活在最糟糕的世界里。还是要谢谢你的帮助!