Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/macos/9.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何打开.data文件扩展名_Python_Macos_File Extension - Fatal编程技术网

Python 如何打开.data文件扩展名

Python 如何打开.data文件扩展名,python,macos,file-extension,Python,Macos,File Extension,我正在处理附带的东西,其中提供的数据位于.data文件中。如何打开.data文件以查看数据的外观,以及如何通过python以编程方式读取.data文件?我有Mac OSX 注意:我正在处理的数据是针对某个KDD杯挑战的数据这在很大程度上取决于其中的内容。它可以是二进制文件,也可以是文本文件 如果它是一个文本文件,那么您可以用与打开任何文件相同的方式打开它(f=open(filename,“r”)) 如果它是二进制文件,您只需在open命令中添加一个“b”(open(filename,“rb”))

我正在处理附带的东西,其中提供的数据位于
.data
文件中。如何打开
.data
文件以查看数据的外观,以及如何通过python以编程方式读取
.data
文件?我有Mac OSX


注意:我正在处理的数据是针对某个
KDD杯挑战的数据

这在很大程度上取决于其中的内容。它可以是二进制文件,也可以是文本文件

如果它是一个文本文件,那么您可以用与打开任何文件相同的方式打开它(f=open(filename,“r”))

如果它是二进制文件,您只需在open命令中添加一个“b”(open(filename,“rb”))。这里有一个例子:

根据其中的数据类型,您可能希望尝试通过csv读取器(csv python模块)或xml解析库(例如lxml)传递数据

从上面进一步了解并查看页面后,格式为:

数据格式 数据集使用的格式与关系数据库中的文本导出格式类似:

一个标题行包含变量名 每个实例一行 值之间的分隔符列表 缺少值(连续表格)

因此,请看以下答案:

我建议尝试一次处理一行,而不是加载整个文件,但是如果你有ram为什么不


我怀疑它不会在sublime中打开,因为文件很大,但这只是一个猜测

要快速了解文件可能包含的内容,您可以在终端内使用
字符串
cat
,例如:

$ strings file.data

如果忘记将
-v
选项传递给cat,并且如果是二进制文件,则可能会弄乱终端,因此需要重置:

$ reset

请尝试使用记事本或Gedit检查文件中的分隔符(
.data
文件也是文本文件)。确认后,可以使用python中Pandas库中的
read\u csv
方法

import pandas as pd
file_path = "~/AI/datasets/wine/wine.data"
# above .data file is comma delimited
wine_data = pd.read_csv(file_path, delimiter=",")

我只是自己处理这个问题,所以我想我会分享我的答案。我有一个.data文件,无法通过右键单击打开它。MACOS建议我使用Xcode打开它,所以我尝试了一下,但没有成功

接下来,我尝试使用名为“方括号”的程序打开它。它是一个主要用于HTML和CSS的文本编辑程序。括号起作用了

我也是一名Python程序员,所以我也尝试了PyCharm。Pycharm也工作得很好,我还能够使用以下代码行读取文件:

inf = open("processed-1.cleveland.data", "r")

lines = inf.readlines()

for line in lines:
    print(line, end="")
它对我有用

将熊猫作为pd导入
#在此处定义文件路径
您的_data=pd.read_csv(文件路径,sep=',')
您的_data.head()
我的意思是,只要把它作为一个csv文件,如果它与','分离。
@mustious.

.data
的解决方案不是afaik的标准格式。在记事本中打开它,看看它是否可读。如果不是,请尝试使用十六进制编辑器,尽管如果是二进制数据,您会想询问提供文件的人文件的格式是什么。@Blorgbeard我随身携带一台mac电脑,我试图用升华文本打开它,但它没有打开它根本没有打开?我希望它至少会显示一堆垃圾。如果是挑战,请阅读说明。我确信他们会给你关于格式的信息。打开终端,键入应该给你提示的
file/path/to/somefile.data
。我试着做
f=Open(“dataset.data”,“r”)
,得到
TypeError:file对象的描述符“read”需要一个参数
inf = open("processed-1.cleveland.data", "r")

lines = inf.readlines()

for line in lines:
    print(line, end="")