Python 读取Excel文件并跳过空行
我有一个excel表格,包含如下所示的数据,它包含数据列Python 读取Excel文件并跳过空行,python,pandas,numpy,python-requests,spyder,Python,Pandas,Numpy,Python Requests,Spyder,我有一个excel表格,包含如下所示的数据,它包含数据列 Rahul e34 Pradeep e44 Azhar t54 Venkat r45 Akash e14 Vipul r15 Fairo e45 Akshay e44 Pavan e24 Asad t14 当我运行下面的代码时 import pandas as pd import numpy as np df = pd.read_excel (r'C:\
Rahul e34 Pradeep e44 Azhar t54
Venkat r45 Akash e14 Vipul r15 Fairo e45
Akshay e44
Pavan e24 Asad t14
当我运行下面的代码时
import pandas as pd
import numpy as np
df = pd.read_excel (r'C:\\Users\\Kiran\\Desktop\\Data\\Output1.xlsx')
df=pd.DataFrame(np.reshape(df.to_numpy(),(-1,2)))
df.to_excel("Output2.xlsx")
我得到的输出是
0 1
0 Rahul e34
1 Pradeep e44
2 Azhar t54
3
4 Venkat r45
5 Akash e14
6 Vipul r15
7 Fairo e45
8 Akshay e44
9
10
11
12 Pavan e24
13 Asad t14
14
15
我需要如下所示的输出
Rahul e34
Pradeep e44
Azhar t54
Venkat r45
Akash e14
Vipul r15
Fairo e45
Akshay e44
Pavan e24
Asad t14
第1行(0,1)和第1列(0,1,2,3,4…..15)不应与如何删除空白一起出现。谁能给我指路吗。感谢您的帮助。您可以使用
df.to\u excel()
中的索引和标题
参数。
在将excel读入数据库时,也要使用header=None
。如果不这样做,您将在输出文件中丢失一个观察值
以下是工作代码:
import pandas as pd
import numpy as np
df = pd.read_excel ('input.xlsx',header=None)
df=pd.DataFrame(np.reshape(df.to_numpy(),(-1,2)))
df.dropna(axis=0,inplace=True)
clean_df=df[:].astype('str').apply(lambda x: x.str.strip())
print(clean_df)
df.to_excel("Output.xlsx",index=False,header=False)
谢谢你的代码,它的工作,一个问题-我需要一行一行的数据,现在当我运行代码,我得到空行之间的一些地方,如上所述。是的,我看到了上述问题。然而,我根本没有面对它(我使用了您提供的代码,没有任何改动)。检查用于创建DF的excel文件的格式。如果问题仍然存在,我建议您将输入文件转换为csv,然后尝试相同的方法。将输入文件转换为csv,但中间仍有空行,试图解决问题,但我无法成功,您能否帮助将您正在使用的excel文件以及代码上载到某个位置(例如:gdrive)给我一个链接这个链接包含两个合并的excel表(Input.xlsx Input sheet和Output.xlsx Output sheet)。代码与上面写的代码相同。