Python 数据集中只有一个索引标签

Python 数据集中只有一个索引标签,python,pandas,Python,Pandas,我正在使用来自的ecoli数据集。 edu/ml/datasets/Ecoli。这些值由选项卡分隔。我想索引每一列,并给他们一个名字。但当我使用以下代码执行此操作时: import pandas as pd ecoli_cols= ['N_ecoli', 'info1', 'info2', 'info3', 'info4','info5','info6,'info7','type'] d= pd.read_table('ecoli.csv',sep= ' ',header = None, nam

我正在使用来自的ecoli数据集。 edu/ml/datasets/Ecoli。这些值由选项卡分隔。我想索引每一列,并给他们一个名字。但当我使用以下代码执行此操作时:

import pandas as pd
ecoli_cols= ['N_ecoli', 'info1', 'info2', 'info3', 'info4','info5','info6,'info7','type']
d= pd.read_table('ecoli.csv',sep= ' ',header = None, names= ecoli_cols)

它不为每个索引创建名称,而是创建6个新列。但是我想为我已经拥有的每一列使用这些索引名。稍后我想从这个数据集中提取信息。因此,将它们以逗号分隔或放在表中是很重要的。谢谢

您可以将
url
与数据和分隔符
\s+
一起使用-一个或多个空格:

url = 'http://archive.ics.uci.edu/ml/machine-learning-databases/ecoli/ecoli.data'

ecoli_cols= ['N_ecoli', 'info1', 'info2', 'info3', 'info4','info5','info6','info7','type']
df = pd.read_table(url,sep= '\s+',header = None, names= ecoli_cols)
#alternative use parameter delim_whitespace
#df = pd.read_table(url, delim_whitespace= True, header = None, names = ecoli_cols)


print (df.head())

      N_ecoli  info1  info2  info3  info4  info5  info6  info7 type
0   AAT_ECOLI   0.49   0.29   0.48    0.5   0.56   0.24   0.35   cp
1  ACEA_ECOLI   0.07   0.40   0.48    0.5   0.54   0.35   0.44   cp
2  ACEK_ECOLI   0.56   0.40   0.48    0.5   0.49   0.37   0.46   cp
3  ACKA_ECOLI   0.59   0.49   0.48    0.5   0.52   0.45   0.36   cp
4   ADI_ECOLI   0.23   0.32   0.48    0.5   0.55   0.25   0.35   cp
但如果需要,请使用带有分隔符的文件作为选项卡:

d = pd.read_table('ecoli.csv', sep='\t',header = None, names= ecoli_cols)
如果分隔符是

d = pd.read_table('ecoli.csv', sep=';',header = None, names= ecoli_cols)

使用
sep='\t'
代替
sep=''
它对我不起作用。由于某些原因,我的电脑无法连接url方法。当我在我的代码中给'\t'时,它产生的结果与以前相同。那么
sep='\s+'
如何代替
\t
?与
\t
相同。它没有改变。嗯,那么它似乎是一些数据相关的问题。你能在我的个人资料中将你的文件
ecoli.csv
发送到我的电子邮件吗?分隔符是
,所以需要
sep=';'