从Excel中读取数据并忽略Python中的空行_Python_Excel_Pandas

从Excel中读取数据并忽略Python中的空行

python excel pandas

从Excel中读取数据并忽略Python中的空行,python,excel,pandas,Python,Excel,Pandas,这可能很愚蠢，但我需要从python中的excel导入一些数据，数据打印在工作表的某个位置（不是从A1位置开始）我所掌握的唯一信息是数据从时间戳所在的位置开始（可能在excel工作表中的任何位置）。它以我在这里介绍的格式出现。我使用了两种不同的方法。在xlrd中，我实现了以下代码 items = [] for row in range(d_sheet.nrows): for col in range(d_sheet.nrows): items.append(d

这可能很愚蠢，但我需要从python中的excel导入一些数据，数据打印在工作表的某个位置（不是从A1位置开始）

我所掌握的唯一信息是数据从

时间戳

所在的位置开始（可能在excel工作表中的任何位置）。它以我在这里介绍的格式出现。我使用了两种不同的方法。在xlrd中，我实现了以下代码

 items = []
 for row in range(d_sheet.nrows):
     for col in range(d_sheet.nrows):
         items.append(d_sheet.cell(row,col))
 return items

还有熊猫

 data = pd.read_excel('file.xlsx')
 data.as_matrix()

在这两种情况下，我都会得到许多带有

NaN

值的空行。我想一个简单的解决方案是运行文件并找到

Timestamp

元素，然后从该位置打印到我的文件中。但我想知道是否有其他解决方案可以自动识别数据在excel工作表中的打印位置

p、理想情况下，我希望以DataFrame或dictionary格式存储数据，以便在代码中使用索引和列信息

在这两种情况下，我都会得到许多带有NaN值的空行。我猜一个简单的解决方案是运行文件并找到时间戳元素并从该位置打印到我的文件中。但我想知道如果有任何其他解决方案可以自动确定数据打印在excel表格中

**一个简单的解决方案是运行文件并找到时间戳**

没有别的出路了。如果您没有元素时间戳开始的固定位置，则需要在整个文件中运行并找到元素，即使您在courtain后面有一个解决方案，如“从我的xls中删除所有NaN数据”，这也会在整个文件中运行。

如果DataFrame中有大量NaN数据，您可以使用

df.dropna（）

如图所示：这可能是一个解决方案，但它会删除所有应显示在我的数据中的

NaN

值，对吗？我的意思是，如果我的数据中有一些

NaN

值（非常重要的信息）。谢谢Victor，但是如果

NaN

是我数据中的值呢？这样，我将忽略该值，并确实更改数据的结构。我只需要提取矩阵中的任何值（我的数据中也可能有

NaN

）。对不起，我刚才把你的问题弄糊涂了。我要编辑了。谢谢维克多。我希望看到熊猫或其他图书馆的一些工具来导入数据。但我想，我需要手动操作。干杯。我不是python的重度用户，但我的意思是，即使您使用一些预先制作的解决方案，它也会以相同的逻辑运行。

 data = pd.read_excel('file.xlsx')
 data.as_matrix()