Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/.net/24.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何在R/Python中读取具有多个头的.xls文件进行数据处理?_Python_R_Dataframe_File Read_Data Processing - Fatal编程技术网

如何在R/Python中读取具有多个头的.xls文件进行数据处理?

如何在R/Python中读取具有多个头的.xls文件进行数据处理?,python,r,dataframe,file-read,data-processing,Python,R,Dataframe,File Read,Data Processing,我有下面指定的文件 正如您所看到的,它由许多头层组成,如何在R/Python中读取此文件,以便以正确的格式处理它?您可以在使用Pandas读取时手动指定列名 import pandas as pd file_name = r"/foo/bar/data.xlsx" columns = ["Foo", "Bar", "Baz"] df = pd.read_excel(file_name, header=None, skiprows=7, names=columns) 要设置多个级别的列,请

我有下面指定的文件


正如您所看到的,它由许多头层组成,如何在R/Python中读取此文件,以便以正确的格式处理它?

您可以在使用Pandas读取时手动指定列名

import pandas as pd

file_name = r"/foo/bar/data.xlsx"
columns = ["Foo", "Bar", "Baz"]

df = pd.read_excel(file_name, header=None, skiprows=7, names=columns)
要设置多个级别的列,请执行以下操作:

df = pd.DataFrame({'Foo':[1,2,3],'Bar':[2,4,6], "Baz": [3, 6, 9]})
columns = [("Cereals", "Rice", "Autumn"), ("Cereals", "Rice", "Summer"), ("Cereals", "Wheat", "Winter")]
df.columns = pd.MultiIndex.from_tuples(columns)

在pandas中,您可以查看分层索引(多索引)


但是,当你在正确的标题之后,做为“蝙蝠侠”,通过阅读和应用你自己的列标题

你认为什么是“适当的”?每列有2个以上的标题,如何管理,所以我最终会有正确的1个头数据集!好的,但是dataset中的每一列都根据多个标题归入不同的类别,那么我如何才能保留层次结构呢?例如,“秋天”一栏在“大米”标题下,而“谷类和小米”标题下。这就是为什么我问你认为什么是合适的。请看编辑后的答案。好的!我第一次处理这种类型的文件,所以有点困惑,甚至我不知道什么是适合这种格式。谢谢你的建议,我会试试这个。有没有使用R的解决方案?