从Excel中读取数据并忽略Python中的空行
这可能很愚蠢,但我需要从python中的excel导入一些数据,数据打印在工作表的某个位置(不是从A1位置开始) 我所掌握的唯一信息是数据从从Excel中读取数据并忽略Python中的空行,python,excel,pandas,Python,Excel,Pandas,这可能很愚蠢,但我需要从python中的excel导入一些数据,数据打印在工作表的某个位置(不是从A1位置开始) 我所掌握的唯一信息是数据从时间戳所在的位置开始(可能在excel工作表中的任何位置)。它以我在这里介绍的格式出现。 我使用了两种不同的方法。在xlrd中,我实现了以下代码 items = [] for row in range(d_sheet.nrows): for col in range(d_sheet.nrows): items.append(d
时间戳
所在的位置开始(可能在excel工作表中的任何位置)。它以我在这里介绍的格式出现。
我使用了两种不同的方法。在xlrd中,我实现了以下代码
items = []
for row in range(d_sheet.nrows):
for col in range(d_sheet.nrows):
items.append(d_sheet.cell(row,col))
return items
还有熊猫
data = pd.read_excel('file.xlsx')
data.as_matrix()
在这两种情况下,我都会得到许多带有NaN
值的空行。
我想一个简单的解决方案是运行文件并找到Timestamp
元素,然后从该位置打印到我的文件中。但我想知道是否有其他解决方案可以自动识别数据在excel工作表中的打印位置
p、 理想情况下,我希望以DataFrame或dictionary格式存储数据,以便在代码中使用索引和列信息
在这两种情况下,我都会得到许多带有NaN值的空行。我猜
一个简单的解决方案是运行文件并找到时间戳
元素并从该位置打印到我的文件中。但我想知道
如果有任何其他解决方案可以自动确定
数据打印在excel表格中
**一个简单的解决方案是运行文件并找到时间戳**
没有别的出路了。如果您没有元素时间戳开始的固定位置,则需要在整个文件中运行并找到元素,即使您在courtain后面有一个解决方案,如“从我的xls中删除所有NaN数据”,这也会在整个文件中运行。如果DataFrame中有大量NaN数据,您可以使用
df.dropna()
如图所示:这可能是一个解决方案,但它会删除所有应显示在我的数据中的NaN
值,对吗?我的意思是,如果我的数据中有一些NaN
值(非常重要的信息)。谢谢Victor,但是如果NaN
是我数据中的值呢?这样,我将忽略该值,并确实更改数据的结构。我只需要提取矩阵中的任何值(我的数据中也可能有NaN
)。对不起,我刚才把你的问题弄糊涂了。我要编辑了。谢谢维克多。我希望看到熊猫或其他图书馆的一些工具来导入数据。但我想,我需要手动操作。干杯。我不是python的重度用户,但我的意思是,即使您使用一些预先制作的解决方案,它也会以相同的逻辑运行。
data = pd.read_excel('file.xlsx')
data.as_matrix()