Excel 在数据框上使用运算符链接来读取数据、删除不需要的列、重命名列和读取少量行
在最终使用之前,我有一个数据集来读取和清理数据 我知道如何通过以下单独的独立步骤做到这一点:Excel 在数据框上使用运算符链接来读取数据、删除不需要的列、重命名列和读取少量行,excel,python-2.7,pandas,select,multiple-columns,Excel,Python 2.7,Pandas,Select,Multiple Columns,在最终使用之前,我有一个数据集来读取和清理数据 我知道如何通过以下单独的独立步骤做到这一点: data = pd.read_excel('C:\Users\pappu.a.kumar\Documents\data\coursera\python\Energy Indicators.xls',skiprows=17, skip_footer=0) del data['Unnamed: 0'] del data['Unnamed: 1'] data.columns =
data = pd.read_excel('C:\Users\pappu.a.kumar\Documents\data\coursera\python\Energy Indicators.xls',skiprows=17, skip_footer=0)
del data['Unnamed: 0']
del data['Unnamed: 1']
data.columns = ['Country', 'Energy Supply', 'Energy Supply per Capita', '% Renewable']
fdata = data.ix[:226]
现在我想使用操作符链接来完成所有这些步骤。我的第一次尝试写在下面:
data = (pd.read_excel('C:\Users\pappu.a.kumar\Documents\data\coursera\python\Energy Indicators.xls',skiprows=17, skip_footer=0)
.(del data['Unnamed: 0'])
.(del data['Unnamed: 1'])
.(columns = ['Country', 'Energy Supply', 'Energy Supply per Capita', '% Renewable'])
.(ix[:226]))
但此代码产生以下错误:
文件“”,第3行
(删除数据['未命名:0'])
^
SyntaxError:无效语法
我不知道我在做什么在逻辑上是可能的还是不可能的。如果可能的话,对正确文档或代码本身的任何引用都将不胜感激。如果未命名列的位置仍然相同,请在中使用参数
名称设置新列名称,然后通过删除不必要的列。可以使用.iloc[226]
,.head(226)
,.ix(226)
:
另一种可能的解决方案是重命名列:
data = pd.read_excel('C:\Users\pappu.a.kumar\Documents\data\coursera\python\Energy Indicators.xls',skiprows=17, skip_footer=0)
.drop(['Unnamed: 0','Unnamed: 1'], axis=1)
.rename(columns={'firstcol':'Country', 'secondcol': 'Energy Supply', ...})
.head(226)
您正在查找.drop('Unnamed:0',axis=1)
。谢谢,它确实有帮助@IanS@piRSquared. 恭喜。也许你可以用什么东西陷害另一个人,这样他就被禁止了?开玩笑的。如果删除的列不是最后一列,这会起同样的作用吗?
data = pd.read_excel('C:\Users\pappu.a.kumar\Documents\data\coursera\python\Energy Indicators.xls',skiprows=17, skip_footer=0)
.drop(['Unnamed: 0','Unnamed: 1'], axis=1)
.rename(columns={'firstcol':'Country', 'secondcol': 'Energy Supply', ...})
.head(226)