如何使用Python 3和pandas从多个excel工作表中提取并组合相同的行号?
这是针对Python的。我有一个名为“translation.xlsx”的excel文件,其中有3张表格,上面标有将8行相同文本从俄语翻译成英语的人的姓名。在这里你可以看到其中两张纸的英文翻译 我想,如果可能的话,使用熊猫,但另一个图书馆是好的,从每张纸上拿出第1行,把它们放在一起,这样我就有了 “Bob翻译第1行,Fed翻译第1行,Raj翻译第1行” 然后 “第2行的Bob翻译,第2行的Fed翻译,第2行的Raj翻译”一起 e、 g。 第一排:法国男子起诉优步破坏婚姻(美联储)/法国人起诉优步破坏婚姻(鲍勃)/法国人起诉优步破坏婚姻(拉吉) 输出格式并不重要。它可以是列表、数据框、excel、字典等,只要我能为每一行相邻的每个人的翻译拍照。带有人名和行号的标签也不重要,若可以包括,可以,但若不包括,则没问题 这里没有代码,因为尽管我花了很长时间尝试使用如何使用Python 3和pandas从多个excel工作表中提取并组合相同的行号?,python,excel,pandas,Python,Excel,Pandas,这是针对Python的。我有一个名为“translation.xlsx”的excel文件,其中有3张表格,上面标有将8行相同文本从俄语翻译成英语的人的姓名。在这里你可以看到其中两张纸的英文翻译 我想,如果可能的话,使用熊猫,但另一个图书馆是好的,从每张纸上拿出第1行,把它们放在一起,这样我就有了 “Bob翻译第1行,Fed翻译第1行,Raj翻译第1行” 然后 “第2行的Bob翻译,第2行的Fed翻译,第2行的Raj翻译”一起 e、 g。 第一排:法国男子起诉优步破坏婚姻(美联储)/法国人起诉
sheet\u name=None
将所有sheetnames用于数据帧字典,但我还是无法接近:
dfs = pd.read_excel('a.xlsx', sheet_name=None, header=None)
print (dfs)
OrderedDict([('Bob', 0
0 a
1 b
2 c), ('Fed', 0
0 a1
1 b1
2 c1), ('Raj', 0
0 a1
1 b2
2 c2)])
然后通过以下方式连接在一起:
最后通过join
将行连接在一起,并转换为一列DataFrame
:
df1 = df.apply(' / '.join, axis=1).to_frame('out')
print (df1)
out
0 a / a1 / a1
1 b / b1 / b2
2 c / c1 / c2
df1 = df.apply(' / '.join, axis=1).to_frame('out')
print (df1)
out
0 a / a1 / a1
1 b / b1 / b2
2 c / c1 / c2
df_Bob = pd.read_excel('translation.xlsx', sheet_name = 'Bob')
df_Fed = pd.read_excel('translation.xlsx', sheet_name = 'Fed')
df_Raj = pd.read_excel('translation.xlsx', sheet_name = 'Raj')
df_concat = pd.concat([df_Bob, df_Fed, df_Raj] , axis = 1)
df= df_concat.apply(' / '.join, axis=1).to_frame('ColumnName')
prinf(df)