Python 迭代excel工作表并创建一个数据框
我试图迭代几个excel工作表,并将特定信息(每个工作表中名为“Value”的列)提取到单个DataFrame对象中 我做了以下工作:Python 迭代excel工作表并创建一个数据框,python,excel,dataframe,data-structures,Python,Excel,Dataframe,Data Structures,我试图迭代几个excel工作表,并将特定信息(每个工作表中名为“Value”的列)提取到单个DataFrame对象中 我做了以下工作: import pandas as pd import numpy as np df=pd.read_excel("file / path", sheet_name=None) df然后作为OrderedDict和其中的一些其他数据结构获取。看起来是这样的: ([('Austria',
import pandas as pd
import numpy as np
df=pd.read_excel("file / path", sheet_name=None)
df然后作为OrderedDict和其中的一些其他数据结构获取。看起来是这样的:
([('Austria',
Name Value
0 3 BG EMCore Convertibles Global CHF R T 5
1 3 BG EMCore Convertibles Global R T 6
[2 rows x 2 columns]),
('Belgium',
Name Value
0 AG Life Alternative Investments 7
1 AG Life Balanced 1
2 AG Life Bonds Global 2
3 AG Life Bonds Indexed 7
[4 rows x 2 columns])])
Austria Belgium
0 5 7
1 6 1
2 NaN 2
3 NaN 7
问题是我不知道如何进一步分解和检查此数据结构中的元素。我希望最终创建一个数据帧,该数据帧仅具有上述数据结构中的“值”。列的名称可以是任意的;如果它们是国家的名字就最好了。看起来是这样的:
([('Austria',
Name Value
0 3 BG EMCore Convertibles Global CHF R T 5
1 3 BG EMCore Convertibles Global R T 6
[2 rows x 2 columns]),
('Belgium',
Name Value
0 AG Life Alternative Investments 7
1 AG Life Balanced 1
2 AG Life Bonds Global 2
3 AG Life Bonds Indexed 7
[4 rows x 2 columns])])
Austria Belgium
0 5 7
1 6 1
2 NaN 2
3 NaN 7